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Vorwort 


Liebe Leser:innen, 


der Umgang mit quantitativen Daten der sozial- und bildungswissenschaftli- 
chen Forschung stellt für Bachelor- und Masterstudierende mitunter eine gewis- 
se Herausforderung dar. Unsicherheiten bestehen dabei sowohl hinsichtlich der 
Verfügbarkeit bereits existierender quantitativer (Sekundär-)Daten als auch be- 
züglich der Möglichkeiten einer eigenständigen Erhebung quantitativer (Primär-) 
Daten. Vor diesem Hintergrund entstand innerhalb der Arbeitsgruppe „Quan- 
titative Methoden empirischer Sozialforschung“ am Institut für Soziale Arbeit 
und Sozialpolitik der Universität Duisburg-Essen die Idee, ein außercurriculares 
Seminar zum Thema anzubieten, das derartige Vorbehalte abbauen und zur Nut- 
zung quantitativer Daten anregen sollte. Dieses Angebot fand im Wintersemester 
2021/2022 für Bachelor- und Masterstudierende der Studiengänge Soziale Ar- 
beit, Erziehungswissenschaft sowie Erziehungswissenschaften und des Lehramts 
(im bildungswissenschaftlichen Teil) unter dem Titel „Quantitative Daten in bil- 
dungswissenschaftlichen Disziplinen“ statt. Thematisch fokussierte Lehreinheiten 
wechselten sich darin mit Gastvorträgen externer Expert:innen zu verschiedenen 
ausgewählten Themenfeldern im Bereich der quantitativen Sozialforschung ab. 

Bereits bei der Planung des Seminars ergab sich die Idee, Kernelemente des 
Seminars auch nachfolgenden Studierendengenerationen in Form eines Sammel- 
bandes zur Verfügung zu stellen. Die Autor:innen der verschiedenen Gastvorträge 
erklärten sich überwiegend bereit, mit entsprechenden Beiträgen mitzuwirken; 
weitere Autor:innen konnten gewonnen werden. Daher freuen wir uns nun als Her- 
ausgeber:innen, ein Sammelwerk präsentieren zu können, das sowohl die Vorzü- 
ge quantitativer Forschung in bildungswissenschaftlichen Disziplinen als auch die 
großen Potenziale einer Verschränkung quantitativer und qualitativer Methoden in 
Mixed-Methods-Studien hervorhebt. Studierenden verschiedener Fachrichtungen 
wird hiermit ein unterstützender Leitfaden an die Hand gegeben, welcher es ihnen 
ermöglicht, ihre quantitativen Datenkompetenzen jenseits der klassischen Statis- 
tiklehre zu erweitern und den Einstieg in die (eigenständige) empirische Sozial- 
forschung zu erleichtern. 

Ermöglicht wurde dieser Sammelband durch die Unterstützung und das Enga- 
gement unterschiedlicher Personen und Institutionen, denen wir an dieser Stelle 
herzlich danken möchten: 


Vorwort 


Besonderer Dank gilt dem durch das Ministerium für Kultur und Wissenschaft 
des Landes Nordrhein-Westfalen und den Stifterverband für die Deutsche 
Wissenschaft e.V. im Rahmen von „Data Literacy Education.nrw“ geförder- 
ten DataCampus-Projekt der Universität Duisburg-Essen, welches durch seine 
großzügige finanzielle Förderung, die durch Haushaltsmittel des Rektorats der 
Universität aufgestockt worden ist, die Durchführung des Seminars und die 
Erstellung eines Sammelbandes erst ermöglichte. Besonderer Dank gilt hier 
Dr. Patrick Hintze und Christina Kläre für die kontinuierliche begleitende Be- 
ratung. 

Ganz besonders möchten wir an dieser Stelle ebenfalls den Autor:innen dan- 
ken, welche durch ihre vielseitige Expertise und die Bereitschaft zu einem 
schriftlichen Beitrag nicht nur das Erscheinen des Sammelbandes, sondern 
auch dessen breites inhaltliches Profil ermöglichten. Auch die Teilnehmer:in- 
nen unseres Seminars bereicherten durch ihre aktive Teilnahme und kritischen 
Rückfragen das inhaltliche Konzept. 

Schließlich möchten wir uns bei den Mitarbeiter:innen des Verlags Barbara Bu- 
drich für die Unterstützung unserer Publikationsidee sowie die gute Koopera- 
tion und Betreuung im Entstehungsprozess dieses Werkes herzlich bedanken, 
insbesondere bei Franziska Deller, Brinja Lotz, Sarah Rögl und Christine Wa- 
ckers, sowie bei Ulrike Weingärtner (TextAkzente) für das hervorragende Lek- 
torat und den Buchsatz. 


Allen Leser:innen wünschen wir bei der Lektüre dieses Buches, ebenso wie bei 


der Anwendung seiner Inhalte, viel Freude, guten Erfolg und interessante (For- 
schungs-)Einsichten. 


Die Herausgeber:innen 
Jessica Gröber, Marc Andre Kellert & Dirk Hofäcker Essen, März 2023 


1 Einleitung: Zur Rolle quantitativer Daten in 
bildungswissenschaftlichen Disziplinen 


Jessica Gröber 


Der Vermittlung von Datenkompetenzen (Data Literacy) kommt in der universi- 
tären Ausbildung angesichts des digitalen Wandels sowie der zunehmenden Re- 
levanz und Zugänglichkeit von Daten in Politik, Wissenschaft und Wirtschaft eine 
immer größer werdende Bedeutung zu. In einigen Studiengängen - beispielswei- 
se der Informatik — sind Kompetenzen im Umgang mit Daten ihrem Wesen ent- 
sprechend längst curricular verankert. In bildungswissenschaftlichen Disziplinen 
hingegen stellen diese eher eine Besonderheit dar. Dabei ist Data Literacy längst 
keine ausschließlich disziplinspezifische Angelegenheit mehr. Insbesondere in 
der Arbeitswelt — und speziell der Wissenschaft — stellt der Umgang mit Daten 
oft eine Kernkompetenz dar. Es gilt daher den Erwerb von Datenkompetenzen 
disziplinübergreifend und zugleich -spezifisch in der akademischen Bildung zu 
fördern. Vor diesem Hintergrund hat sich das Projekt DataCampus UDE! (https:// 
www.uni-due.de/ub/datacampus/) zur Aufgabe gemacht, entsprechende Angebo- 
te an der Universität Duisburg-Essen zu schaffen. Im Rahmen des Projekts werden 
Lehrveranstaltungen, Lehrorte sowie Lehr-Lern-Materialien zum Thema Data Lite- 
racy entwickelt, die in erster Linie Lehrende und Studierende, darüber hinaus aber 
auch weitere interessierte Personen adressieren. 

Ein Beispiel dieser geförderten Projekte ist die Konzeption und Durchführung 
der Lehrveranstaltung „Quantitative Daten in bildungswissenschaftlichen Diszipli- 
nen“, deren Struktur und Inhalte dieser gleichnamige Sammelband aufgreift. Der 
Titel bezieht sich dabei im Wesentlichen auf zwei Aspekte: zum einen auf Daten- 
kompetenzen im Kontext von quantitativer empirischer Sozialforschung und zum 
anderen auf die primär adressierte Zielgruppe — die bildungswissenschaftlichen 
Disziplinen. Beide werden nachfolgend näher erläutert. 


1 Gefördert durch Data Literacy Education.nrw (https://www.stifterverband.org/data-lite- 
racy-education) vom Ministerium für Kultur und Wissenschaft des Landes Nordrhein- 
Westfalen in Kooperation mit dem Stifterverband. 
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„Bildungswissenschaftliche Disziplinen“ im Kontext dieses Sammelbandes 


Die dem Sammelband zugrunde liegende Lehrveranstaltung wurde im Winterse- 
mester 2021/2022 an der Universität Duisburg-Essen, insbesondere für die (Mas- 
ter-)Studiengänge des Lehramts, der Erziehungswissenschaft sowie der Sozialen 
Arbeit, angeboten, welche allesamt an der dortigen Fakultät für Bildungswissen- 
schaften angesiedelt sind. Diese Studiengänge stellen damit im Ursprung die im 
Titel adressierten „bildungswissenschaftlichen Disziplinen“ dar. Da die verhältnis- 
mäßig junge Bezeichnung „Bildungswissenschaften“ bis heute über keine etablierte 
trennscharfe Definition verfügt (vgl. Krüger 2019: 16f.), soll sie im Kontext dieses 
Sammelbandes als ein Überbegriff für diejenigen wissenschaftlichen Disziplinen 
verstanden werden, welche sich in irgendeiner Form mit Bildung über den gesam- 
ten Lebenslauf beschäftigen (vgl. ebd.: 10, 16f.; Terhart: 28ff.). 


„Quantitative Daten“ im Kontext dieses Sammelbandes 


Was diese universitären Disziplinen außerdem vereint, ist die Forschung mit Men- 
schen und über die soziale Realität. In diesem Zusammenhang ist die Lehre und An- 
wendung der Methoden empirischer Sozialforschung, zu der auch die empirische 
Bildungsforschung gehört, Bestandteil der Curricula dieser Studiengänge (vgl. 
Reinders/Ditton 2015: 49; Baur/Blasius 2014a: 41). 


„Ohne die ‚Methoden der empirischen Sozialforschung‘ kann nicht em- 
pirisch geforscht werden, da diese die Regeln festschreiben, nach denen 
Daten erhoben, mit Theorien verknüpft und anschließend ausgewertet 
werden. Nicht umsonst sind daher die ‚Methoden der empirischen Sozi- 
alforschung‘ unverzichtbarer Bestandteil der Ausbildung in vermutlich 
jedem sozialwissenschaftlichen Studiengang, sei es die Soziologie, die 
Politikwissenschaft oder die Erziehungswissenschaft.“ (Baur/Blasius 
2014a: 41). 


Traditionell wird in der empirischen Sozialforschung zwischen qualitativen und 
quantitativen Methoden unterschieden (vgl. ebd.: 40). Während qualitative Metho- 
den das Ziel des Verständnisses subjektiver Erfahrungen, der detaillierten Analyse 
von sozialen Interaktionen respektive Situationen sowie latenter Sinnstrukturen 
verfolgen (vgl. Flick 2014: 298), versuchen quantitative Methoden mittels standar- 
disierter und statistischer Verfahren verallgemeinerbare Aussagen über eine zuvor 
definierte Grundgesamtheit zu treffen (vgl. Häder 2014: 302; Häder 2019: 14). 
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Grundlage der empirischen Sozialforschung - sei es quantitativ, qualitativ oder eine 
Kombination? - ist die Arbeit mit Daten. Folglich beziehen sich die für bildungswis- 
senschaftlichen Disziplinen relevanten Datenkompetenzen vor allem auf solche, die 
sowohl zur Durchführung eigener Studien als auch zum Verständnis fremder Stu- 
dien befähigen. Im qualitativen Kontext liegen solche Daten meist in Textform vor 
und werden mittels kategorisierender oder interpretativer Verfahren ausgewertet 
(vgl. Flick 2014: 298ff.). Im quantitativen Kontext hingegen basieren diese auf nu- 
merischen Werten, welche mittels statistischer Verfahren analysiert werden (vgl. 
Häder 2014: 304f.). Letztere entsprechen den im Titel genannten „quantitativen 
Daten“. 

Gegenstand dieses Sammelbandes sind somit im weitesten Sinne die Nutzungs- 
möglichkeiten und damit verbundenen Grenzen quantitativer empirischer Sozial- 
forschung bzw. quantitativer Daten in den genannten bildungswissenschaftlichen 
Disziplinen. Diese Möglichkeiten und Grenzen werden im nachfolgend vorgestell- 
ten Themenblock 1 kritisch diskutiert. Dabei wird im gesamten Sammelband der 
Anspruch verfolgt, weiterführende und ergänzende praktische Kompetenzen zu 
vermitteln und an geeigneten Stellen auf Grundlagenliteratur zu verweisen. 


Struktur dieses Sammelbandes 


Der gesamte Sammelband richtet sich an der Struktur bedeutsamer Datenkompe- 
tenzbereiche im Verlauf eines empirischen Forschungsprozesses aus (siehe Abbil- 
dung 1). Ausgegangen von der Forschungsfrage, folgt auf die Auswahl geeigneter 
Datentypen, die im ersten Themenblock behandelt wird, die Auswahl passender 
Datenquellen. Hat also eine Abwägung der verschiedenen Datenformen — qualita- 
tiv, quantitativ oder eine Kombination - stattgefunden, müssen im nächsten Schritt 
konkrete Daten gefunden oder generiert werden. Genau hier knüpft der zweite 
Themenblock des Sammelbands an, in welchem etablierte und innovative Daten- 
quellen der quantitativen Sozialforschung bzw. für die bildungs- und sozialwissen- 
schaftliche Forschung beispielhaft vorgestellt werden. Hier werden sowohl eigene 
Datenerhebungen (Primärdaten) als auch die Nutzung bereits vorhandener Daten 
(Sekundärdaten) thematisiert. Im Falle eigener Erhebungen können sich — gerade 


2 Oft werden quantitative und qualitative Methoden der empirischen Sozialforschung auf- 
grund unterschiedlicher Grundannahmen, Erkenntniszugänge, methodischer Implikatio- 
nen sowie etablierter Strukturen in der Wissenschaft als schwer miteinander vereinbare 
Antagonisten dargestellt (vgl. ebd.). Hierbei ist es ein Anliegen der Herausgeber:innen, 
trotz der eigenen Expertise im Bereich der quantitativen Methoden empirischer Sozial- 
forschung, auch die Kombinationsmöglichkeiten beider Methoden - Stichwort Mixed-Met- 
hods - an geeigneten Stellen aufzuzeigen und zu bestärken. 
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für Studierende und einzelne Forschende — Herausforderungen in der Rekrutie- 
rung und Erhebung bei spezifischen Zielgruppen ergeben. Im dritten Themenblock 
werden darum allgemeine methodische Strategien im Umgang mit diesen als auch 
Beispiele anhand spezifischer Zielgruppen aufgezeigt. Da es sich, wie erwähnt, bei 
Daten der empirischen Sozialforschung um Daten realer Personen handelt, wid- 
met sich der letzte Themenblock abschließend dem Datenschutz, der eine äußerst 
wichtige Datenkompetenz im Gebiet der empirischen Sozialforschung, aber auch 
feldübergreifend, darstellt. 


Abbildung 1: Schritte und Kompetenzbereiche bei der empirischen Forschung/ 
Struktur des Sammelbandes 


hA S% 
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Quelle: eigene Darstellung 


Kap. 4: Herausforderungen bei der 
— Rekrutierung und Erhebung 
spezifischer Zielgruppen 


Rekrutierung und 
Erhebung 


Kap. 5: Datenschutz in der empirischen 
(Sozial-)Forschung 


Nachfolgend wird auf die Inhalte der verschiedenen Themenblöcke näher einge- 
gangen und ein kurzer Einblick in die verschiedenen Beiträge dieses Sammelban- 
des gegeben. 
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Themenblock 1: Möglichkeiten und Grenzen quantitativer Daten in 
bildungswissenschaftlichen Disziplinen 


Methoden der empirischen Sozialforschung stellen, wie bereits erwähnt, in den ge- 
nannten Studiengängen häufig bereits einen Bestandteil in der Lehre dar. Dennoch 
stoßen insbesondere quantitative Methoden, welche einen stärkeren naturwissen- 
schaftlichen Bezug aufweisen (vgl. Döring/Bortz 2016: 15), einerseits in der Lehre 
und andererseits in der Fachdebatte bildungswissenschaftlicher Studiengänge häu- 
fig auf eine gewisse Skepsis. So existieren bei manchen Studierenden erfahrungs- 
gemäß — vermutlich u.a. durch eine Aversion gegenüber mathematikverbundenen 
Themen wie der Statistik — Blockaden und Vorurteile, die in Lehrveranstaltungen 
zur Vermeidung quantitativer und zur Bevorzugung qualitativer Methoden führen 
können. Diesen Blockaden wollen wir mithilfe dieses Sammelbandes entgegenwir- 
ken und Studierenden praktische Tipps und praxisnahe Beispiele für den Umgang 
mit quantitativen Daten zur Verfügung stellen. 

Auch in disziplinspezifischen Fachdebatten ist die Nutzung quantitativer For- 
schungsmethoden und -daten umstritten. Als Beispiel eignet sich hier der Diskurs 
um die Evidenzbasierung Sozialer Arbeit sowie in diesem Zusammenhang um den 
Einsatz von Wirkungsforschung, welche als Teilgebiet der quantitativen Sozialfor- 
schung nach messbaren, quantifizierbaren Wirkungen sucht (siehe dazu beispiels- 
weise Albus/Micheel/Polutta 2018). Als Kritik angemerkt wird hier insbesondere 
die Gefahr einer „neuen wettbewerbsorientierten und an Kosten-Nutzen-Kriterien 
orientierten Steuerung öffentlicher Leistungen“ (Otto/Polutta/Ziegler 2010: 10). 
Auf methodischer Ebene wird außerdem die Schwierigkeit gesehen, „dass sich die 
Soziale Arbeit im hohen Maße auf partikulare, individual-biografische Problemla- 
gen richtet, die sich innerhalb von lokalen lebensweltlichen Bedingungskonstellati- 
onen ereignen und in ihrer Sinnhaftigkeit erschließen“ (ebd.: 20). Dies läge jedoch 
außerhalb des Erfassungsbereichs quantitativer Methoden. Die Autor:innen dieser 
kritischen Zitate sehen dennoch gleichzeitig Potenzial der Wirkungsforschung in 
der Aufklärung über Wirkmechanismen, „um eine Grundlage für eine empirisch 
informierte, professionelle Prüfung der Angemessenheit einer Intervention bereit 
zu stellen“ (ebd.). Dieses Beispiel veranschaulicht die verschiedenen Perspektiven 
auf die Nutzung quantitativer Daten aus disziplinspezifischer und methodischer 
Sicht, auf die das nachfolgende Kapitel (Kap. 2.1) genauer eingeht. 

Wie aus der genannten Kritik hervorgeht, existieren in der Forschung mit 
quantitativen Methoden Grenzen, die beispielsweise der Individualität von Per- 
sonen nicht in jeder Hinsicht gerecht werden können. Ebenso sind andersherum 
der qualitativen Forschung Grenzen gesetzt, die beispielsweise eine Analyse hoher 
Fallzahlen sowie den Rückschluss auf eine Grundgesamtheit — wie sie z.B. in der 
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Sozialberichterstattung von hohem Nutzen sind - ausschließen. Es gilt daher, „mit 
den für die jeweilige Fragestellung und den Gegenstandsbereich bestmöglich geeig- 
neten Methoden“ (Baur/Blasius 2014a: 40) zu arbeiten, „und das können je nach 
Kontext entweder qualitative oder quantitative oder eine Kombination aus beiden 
Methoden sein. Daher sind quantitative und qualitative Forschung keine Gegensät- 
ze, sie sollten sich vielmehr ergänzen“ (ebd.). Um jedoch für die Forschungsfrage 
geeignete Daten zu finden bzw. erheben zu können, ist zunächst die Kenntnis der 
Möglichkeiten und Grenzen der jeweiligen Forschungsmethoden vonnöten. Dieser 
erste Themenblock diskutiert daher unter dem Titel „Möglichkeiten und Grenzen 
quantitativer Daten in bildungswissenschaftlichen Disziplinen“, in welchem Rahmen 
diese eingesetzt werden können. 

Eingeleitet wird der Themenblock durch den Beitrag „Methodische, methodo- 
logische und fachspezifische Perspektiven auf die Nutzung quantitativer Daten in bil- 
dungswissenschaftlichen Disziplinen“, in welchem die Herausgeber:innen anhand 
ausgewählter methodologischer bzw. methodischer Implikationen und fachspe- 
zifischer Debatten Möglichkeiten und Grenzen quantitativer Daten diskutieren 
(Kap. 2.1). Hierbei wird u.a. auf die oben genannte Debatte um Evidenzbasierung 
in der Sozialen Arbeit sowie auf Perspektiven der verschiedenen als „bildungswis- 
senschaftliche Disziplinen“ zusammengefassten Studiengänge intensiver einge- 
gangen. Der Blick auf die Grenzen quantitativer Methoden eröffnet dabei einen 
Ansatzpunkt für die Möglichkeiten qualitativer Verfahren und vice versa. Der Bei- 
trag verdeutlicht somit die Nutzungsmöglichkeiten quantitativer und qualitativer 
Verfahren sowie auch Ansätze für deren mögliche Kombination. 

Diese Kombinationsmöglichkeiten wiederum - und auch deren Grenzen - dis- 
kutiert im Anschluss Carsten Schröder in seinem Beitrag „Mixed-Methods-Forschung 
als methodologische und methodische Zukunftsmusik! ? — Beispiele aus der Sozialen Ar- 
beit“ (Kap. 2.2). Mithilfe von Good-Practice-Beispielen veranschaulicht er vorbild- 
liche Mixed-Methods-Designs aus dem Bereich der Sozialen Arbeit und diskutiert 
deren Verwendung auf einem professionstheoretischen Level. Zusammengefasst 
zeigt dieser erste Themenblock somit Möglichkeiten der Nutzung quantitativer 
Daten in bildungswissenschaftlichen Disziplinen auf, ermutigt zu deren Anwen- 
dung, aber auch gleichzeitig dazu, deren Verwendung kritisch zu hinterfragen 
und einzugrenzen. Entsprechend soll die Kompetenz gestärkt werden, die Eignung 
verschiedener Datentypen und Kombinationsmöglichkeiten zur Bearbeitung der 
eigenen Forschungsfrage abzuwägen. Im nächsten Schritt müssen nun die Daten 
aus geeigneten Quellen bezogen werden. Dem widmet sich Themenblock 2, der 
„Etablierte und innovative Datenquellen in der bildungs- und sozialwissenschaft- 
lichen Forschung“ vorstellt. 
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Themenblock 2: Etablierte und innovative Datenquellen in der bildungs- und 
sozialwissenschaftlichen Forschung 


Bei der Auswahl geeigneter Datenquellen zur Bearbeitung der eigenen Forschungs- 
frage ist im Forschungskontext zunächst dazu die Unterscheidung von (quantitati- 
ven) Daten in sogenannte Primär- und Sekundärdaten vonnöten. Definiert werden 
diese immer in Bezug auf das eigene Forschungsvorhaben. Werden Daten eigens 
zur Bearbeitung des eigenen Forschungsvorhabens erhoben, werden diese als Pri- 
märdaten bezeichnet. Verwendet man allerdings bereits existierende Daten, die 
ursprünglich zu anderen Zwecken erhoben wurden, nennt man diese Sekundär- 
daten (vgl. Richter/Paier/Reiger 2021: 20f.). Folglich hat eine eigene Erhebung 
den Vorteil, passgenau benötigte Daten zu generieren, während der Rückgriff auf 
Sekundärdaten hingegen meist zeit- und ressourcensparender ist (vgl. Begemann/ 
Birkelbach 2019: 5f.). Es empfiehlt sich daher, im Zuge der Recherche von Theorie 
und Forschungsstand auch nach bereits vorhandenen Daten, die zur Forschungs- 
frage passen, zu suchen. Auch eine Kombination von Primär- und Sekundärdaten 
kann eine Bereicherung für das eigene Forschungsvorhaben sein. Auffindbar sind 
viele sozial- und bildungswissenschaftliche Sekundärdaten über die Webseite des 
Rates für Sozial- und Wirtschaftsdaten (RatSWD), welcher aktuell ein Netzwerk aus 
41 Forschungsdatenzentren (FDZ) unterstützt. Für den Bereich der Bildungswissen- 
schaften sind hier u.a. das FDZ Bildung sowie die FDZs des Deutschen Jugendinsti- 
tuts (FDZ-DJI), des Deutschen Zentrums für Integrations- und Migrationsforschung 
(DeZIM.fdz) sowie des Leibniz-Instituts für Bildungsverläufe (FDZ-LIfBi) zu nennen. 


Sekundärdaten: Surveydaten und amtliche Statistik 


Sekundärdaten wiederum lassen sich in zwei große Themenbereiche — Survey- 
bzw. Befragungsdaten und die amtliche Statistik — unterteilen (vgl. Porst 2014a: 
555f.). Letztere „produziert Daten, die auf Basis einer Rechts- oder Verwaltungs- 
vorschrift anfallen oder gezielt für politisch-administrative Zwecke erhoben wer- 
den. Die Auswertung stellt also per Definition immer eine Sekundäranalyse dar“ 
(Begemann/Birkelbach 2019: 7). Vorteile der Nutzung amtlicher Daten bestehen 
insbesondere in hohen Fallzahlen, geringen Ausfallquoten, der Zuverlässigkeit der 
Angaben sowie dem Vorhandensein einiger vergleichsweise „objektiver“ Daten 
(beispielsweise das Einkommen) (vgl. Hartmann/Lengerer 2019: 1225f.; Artelt et 
al. 2019: 24). Nachteilig hingegen ist oft der noch „rohe“ Zustand der Daten, wel- 


3 Schöne Beispiele für die Verwendung von Sekundärdaten in der Kinder- und Jugendhilfe 
finden sich im Sammelband „Forschungsdaten für die Kinder- und Jugendhilfe - Qualita- 
tive und quantitative Sekundäranalysen“ von Begemann/Birkelbach (2019). 
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cher aufwendige Vorarbeiten verlangt (vgl. Egeler et al. 2012: 279), der begrenzte 
Umfang verwertbarer Variablen sowie die bereits erwähnte fehlende Passung zur 
eigenen Forschungsfrage (vgl. Hartmann/Lengerer 2019: 1226f.). 

Ein Beispiel für amtliche Daten sind die der Deutschen Rentenversicherung 
Bund, welche über das FDZ der Rentenversicherung (FDZ-RV) zu wissenschaftlichen 
Zwecken zur Verfügung stehen. Die Möglichkeiten der Nutzung des FDZ-RV erläu- 
tern Leila Akremi und Katharina Werhan von der Deutschen Rentenversicherung 
Bund in ihrem Beitrag „Prozessproduzierte Verwaltungsdaten am Beispiel des FDZ- 
RV“ zu Beginn des zweiten Themenblocks (Kap. 3.1). Hierbei gehen sie u.a. auf die 
Spezifika, die Entstehung und Analysemöglichkeiten prozessproduzierter Daten, 
das Datenangebot der Deutschen Rentenversicherung und deren Zugangsmöglich- 
keiten sowie auf zwei exemplarische Forschungsbeispiele aus dem sozialwissen- 
schaftlichen Bereich (Erwerbsverläufe von Migrant:innen und Effekte politischer 
Reformen) ein. 

Die Datenzugänge in den Forschungsdatenzentren werden meist in sogenann- 
te Public Use Files (PUF) und Scientific Use Files (SUF) unterschieden (vgl. Hart- 
mann/Lengerer 2019: 1228). Den Bezeichnungen entsprechend sind der Zugang 
zu und die Nutzung der Daten entweder öffentlich oder ausschließlich zu wissen- 
schaftlichen Zwecken möglich. Ähnliche Klassifizierungen finden sich auch auf 
etablierten Websites für Survey- bzw. Umfragedaten wie der des Leibniz-Instituts 
für Sozialwissenschaften (GESIS). Hierüber lassen sich u. a. die Daten der Allgemei- 
nen Bevölkerungsumfrage (ALLBUS), des International Social Survey Programme 
(ISSP) und des Eurobarometers finden. Zu den bekanntesten Umfragen der empiri- 
schen Sozial- und Bildungsforschung gehören außerdem das Sozio-oekonomische 
Panel (SOEP), das Nationale Bildungspanel (NEPS) sowie der European Social 
Survey (ESS). 

Wie einfach hier der entsprechende Zugang zu den Daten ist, verdeutlicht 
Moritz Heß exemplarisch in seinem Beitrag „Der (relativ) unkomplizierte Zugang 
zu und die Analyse von quantitativen Sekundärdaten am Beispiel des DEAS und ESS“ 
(Kap. 3.2). Thematisch greift er dabei - wie im Beitrag zuvor — das Thema der Al- 
ter(n)sforschung auf. Einer allgemeinen Erläuterung des Deutschen Alterssurveys 
(DEAS) und des European Social Surveys (ESS) folgen hier pragmatische Beschrei- 
bungen des Zugangs zu diesen sowie beispielhafte Fragestellungen, Auswertun- 
gen und Ergebnisdarstellungen. Insbesondere Studierende werden durch diesen 
Beitrag mit praktischer Anleitung und Beispielen zur Nutzung von Sekundär- re- 
spektive Surveydaten ermutigt. Zu den Vorteilen solcher Surveydaten gehört die 
umfassende Erhebung unterschiedlicher für die wissenschaftliche Forschung re- 
levanter Indikatoren, die auch Einstellungsfragen und subjektive Indikatoren um- 
fassen können (vgl. Hartmann/Krug 2009: 123f.). Gleichzeitig haben Surveydaten 
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gegenüber der amtlichen Statistik aber den Nachteil, dass sie geringe Fallzahlen für 
spezifische Zielgruppen aufweisen und sich beispielsweise durch Nichtteilnahme 
und Antwortverweigerungen Verzerrungen in der Stichprobe ergeben können. Wie 
allen Sekundärdaten außerdem gemein ist, besteht die Möglichkeit, dass diese zur 
Bearbeitung der eigenen Frage nicht immer ausreichend und vollumfänglich dien- 
lich sind (vgl. Hartmann/Lengerer 2019: 1225ff.). 


Primärdatenerhebung 


Trifft Letzteres zu, sollte über eine eigene Erhebung der benötigten Daten nach- 
gedacht werden. Zu allgemeinen Techniken der Erhebung liegen bereits hilfreiche 
praxisorientierte Anleitungen vor (z.B. Häder 2019; Baur/Blasius 2014b; Micheel 
2010; Porst 2014b), weshalb hier auf eine ausführlichere Darstellung verzichtet 
wird. Einer Methode kommt bislang jedoch in der bildungs- und sozialwissen- 
schaftlichen Lehre wenig Aufmerksamkeit zu — der Analyse sozialer Netzwerke. 
Gleichwohl kann diese gerade im Kontext sozial- und bildungswissenschaftlicher 
Forschung von hohem Nutzen sein. Ein Beispiel dafür zeigt Mojgan Stegl in ihrem 
Beitrag „Soziale Netzwerkvisualisierung in der bildungswissenschaftlichen For- 
schung mit Stata und VennMaker““ (Kap. 3.3) auf. Hierbei geht sie zunächst auf 
die Grundbegriffe und Maßzahlen der sozialen Netzwerkanalyse ein und erläutert 
anschließend den Unterschied zwischen Gesamtnetzwerken und egozentrierten 
Netzwerken. Verdeutlicht wird das Potenzial dieser Methode anhand des Beispiels 
der Erfassung des für die Sozial- und Bildungswissenschaften relevanten Konzep- 
tes des sozialen Kapitals (vgl. Bourdieu 1983; Coleman 1988). Dem schließen sich 
praxisorientierte Erläuterungen zur Erfassung, Beschreibung und Darstellung so- 
zialer Netzwerke an, die anhand eines Beispiels veranschaulicht werden. 

Der Begriff der sozialen Netzwerke wird mittlerweile nahezu synonym für On- 
line-Anwendungen wie Facebook’, Twitter”, Instagram” und Co. genutzt, was auf 
deren Struktur zurückzuführen ist. Durch Interaktionen zwischen verschiede- 
nen User:innen, einer Freundes- oder Followerliste sowie gemeinsamen Gruppen 
u.v.m., lassen sich hier — größtenteils sogar vollkommen öffentlich — soziale Bezie- 
hungen nachvollziehen. Viele Plattformen machen sich dieses Anhäufen von Daten 
zunutze, indem sie Schnittstellen zum Zugang zu öffentlich preisgegebenen Infor- 
mationen der Nutzer:innen zum Kauf oder gar kostenfrei zur Verfügung stellen. 
Sam Zeini widmet sich diesem Thema in seinem Beitrag „Soziale Netzwerkanalyse 
auf Basis von sozialen Medien — Praktische Durchführung am Beispiel von Twitter”“ 
(Kap. 3.4). Vordergründig erläutert er hierbei das praktische Vorgehen bei der Ana- 
lyse der Daten sowie der Visualisierung mittels verschiedener Tools am Beispiel 
des Twitter”-Hashtags #bildungabersicher, der im Jahr 2021 dort trendete. Da es 
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sich bei Daten aus den sozialen Medien jedoch zum großen Teil um Individual- 
daten handelt, über deren Ausmaß an öffentlichem Zugang sich die Nutzer:innen 
oft nicht bewusst sind, geht er außerdem auf ethische und rechtliche Aspekte zum 
Schutze der Daten ein. Diese beiden Beiträge zur sozialen Netzwerkanalyse zeigen 
somit eine den Studierenden häufig unbekannte Erhebungsmethode auf, die im 
Falle der Überlegung eigener Erhebungen - oder sogar zur Ergänzung dieser - in 
Betracht gezogen werden sollte. 

Wie erwähnt, existieren zahlreiche einschlägige Lehrbücher, die etablierte 
Vorgehensweisen der Datenerhebung thematisieren. Allerdings gibt es insbeson- 
dere in der eigenen Forschung während des Studiums oftmals Differenzen zwi- 
schen dem theoretischen Idealfall und dem pragmatischen Realfall. Häufig kommt 
es bereits bei der Identifikation der Zielgruppe und Rekrutierung entsprechender 
Studienteilnehmer:innen zu Herausforderungen, über die in einschlägigen Lehr- 
büchern nur bedingt aufgeklärt wird. Im Mittelpunkt des dritten Themenblocks 
stehen daher die Herausforderungen bei der Rekrutierung und Erhebung spezifischer 
Zielgruppen, welche für die adressierten Studiengänge ‚typisch‘ sind. 


Themenblock 3: Herausforderungen bei der Rekrutierung und Erhebung 
spezifischer Zielgruppen 


Eingeleitet wird dieser Abschnitt durch einen Beitrag, der Lösungsansätze für ver- 
schiedene zielgruppenspezifische Herausforderungen auf Basis grundlegender 
Rekrutierungs- und Erhebungsstrategien aufzeigt. Dieser gemeinsame Beitrag 
„Herausforderungen in der empirischen Sozialforschung mit disziplinspezifischen 
Zielgruppen („hard-to-survey populations“)“ (Kap. 4.1) von Anne Bohlender, Jana 
Brix und Thorsten Heien (Kantar Public) mit den Herausgeber:innen Jessica Gröber 
und Dirk Hofäcker profitiert dabei von der konkreten Verdeutlichung derartiger He- 
rausforderungen und Lösungsansätze anhand von Studien des Sozialforschungs- 
unternehmens Kantar Public. Thematisiert werden u.a. Herausforderungen in der 
Forschung mit Kindern und Jugendlichen, Geflüchteten sowie Wohnungslosen. 
Auf diese allgemeinere Erläuterung zielgruppenspezifischer Herausforderun- 
gen folgen zwei Beiträge, die sich jeweils mit einer spezifischen Zielgruppe ausein- 
andersetzen. Eine dieser Zielgruppen sind Menschen mit psychischen Erkrankungen, 
über welche Thomas Forkmann in seinem Beitrag „Empirische Forschung mit Men- 
schen mit psychischen Störungen — Herausforderungen in Rekrutierung und Daten- 
erhebung“ berichtet (Kap. 4.2). Nach einer allgemeinen Einführung in psychische 
Erkrankungen und deren Prävalenzen liefert er praktische Tipps zum Zugang zur 
Zielgruppe und dem Umgang mit krankheitsbedingten Besonderheiten in der For- 
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schung. In diesem Zuge geht er außerdem auf Möglichkeiten zur Kooperation mit 
Einrichtungen sowie das Einholen des Einverständnisses dieser Zielgruppe ein. 

Im zweiten Beitrag befasst sich Kai Hauprich mit der Zielgruppe obdachloser 
Menschen. In seinem Beitrag „Empirische Forschung mit Menschen mit ‚Lebensmittel- 
punkt Straße‘ - Herausforderungen in Rekrutierung und Datenerhebung“ (Kap. 4.3) 
berichtet er von Erfahrungen im Zugang zu und der Forschung mit obdachlosen 
Menschen. Im Rahmen seines Beitrags erläutert er zunächst den Begriff der Ob- 
dachlosigkeit und korrigiert im Zuge der Abgrenzung des Begriffs verbreitete 
Vorurteile. In Anlehnung an seine eigene Promotionsstudie erläutert er dabei die 
spezifischen Herausforderungen sowohl quantitativer als auch qualitativer For- 
schungsdesigns und nimmt somit noch einmal praktischen Bezug auf deren jewei- 
lige Stärken und Schwächen. Themen, die bei unerfahreneren Forschenden oft zu 
Unsicherheiten führen, etwa der Einsatz von Befragungsanreizen (sog. Incentives) 
und herausfordernde Interviewsettings, werden in diesem Beitrag ebenfalls an- 
schaulich diskutiert. Schlussendlich appelliert Kai Hauprich an Forschende, Vorur- 
teile bei der Befragung obdachloser Menschen abzulegen und diese in Forschungen 
unter Anwendung geeigneter Methoden selbst zu Wort kommen zu lassen, anstatt 
ausschließlich vermeintliche Stellvertreter:innen zu befragen. 

Dieser Appell spricht bereits ein wichtiges Thema in der empirischen Sozial- 
forschung an: Im Zuge der Forschung mit Menschen, wie sie in der empirischen 
Sozialforschung stattfindet, sind besondere ethische Richtlinien und rechtliche 
Vorschriften zu beachten. Insbesondere in der Forschung mit spezifischen vulne- 
rablen Zielgruppen, beispielsweise psychisch Erkrankten oder Kindern, wird die 
Notwendigkeit ethischer Abwägungen abermals deutlich. In der Forschung haben 
sich darum ethische Leitlinien und der Einsatz von Ethikkommissionen etabliert. 
Konkrete Leitlinien finden sich beispielsweise im Forschungsethikkodex der Deut- 
schen Gesellschaft für Soziale Arbeit (vgl. DGSA 2020) oder den „Ethical Princip- 
les of Psychologists and Code of Conduct“ der American Psychological Association 
(vgl. APA 2010). Wie aus diesen ersichtlich wird, sind ethische Grundlagen eng mit 
rechtlichen Rahmensetzungen verbunden. Sie dienen als Orientierung für neue 
Gesetze oder lassen sich aus diesen ableiten. Bezugnehmend auf das Thema des 
Buches — quantitative Daten in bildungswissenschaftlichen Disziplinen - sind auch 
speziell im Umgang mit Daten gewisse rechtliche und ethische Vorschriften respek- 
tive Konventionen zum Schutze der Teilnehmenden zu beachten. Der letzte The- 
menblock befasst sich darum mit dem Thema, das bislang meist selten ausführlich 
und praxisnah in Lehrbüchern und -veranstaltungen bildungswissenschaftlicher 
Disziplinen thematisiert wird, gleichwohl es von hoher Relevanz ist: „Datenschutz 
in der empirischen (Sozial-)Forschung“. 
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Themenblock 4: Datenschutz in der empirischen 
(Sozial-)Forschung 


In Bezug auf rechtliche Grundlagen in der Forschung zeigen sich in Lehrveranstal- 
tungen regelmäßig Unsicherheiten seitens der Studierenden. Seit dem EU-weiten 
Inkrafttreten der neuen Datenschutz-Grundverordnung (DSGVO; vgl. ABl. L 119, 
04.05.2016) ist diese durch den medialen Wirbel nahezu jedem:jeder bekannt. 
Damit einher gingen oft die Diskussion und Befürchtung erheblicher Einschrän- 
kungen, die jedoch in diesem Maße nicht auf den Bereich der Wissenschaft zu- 
treffen. Dennoch denken viele Studierende, dass die DSGVO nahezu automatisch 
bei ihren Forschungen greifen würde. Vanessa Lettieri erläutert in ihrem Beitrag 
„Datenschutz in der empirischen (Sozial-)Forschung“ (Kap. 5), wann dies erst der 
Fall ist und welche Schritte dann entsprechend zu beachten sind. Hierbei geht sie 
auf die wichtigsten Artikel der DSGVO und deren praktische Konsequenzen ein, 
adressiert z.B., wie diese gesetzlich verankert sind und welche Informationen sie 
generell oder im besonderen Fall von Minderjährigen umfassen sollten. Zur prak- 
tischen Anwendung bei eigenen Forschungen, befindet sich eine Checkliste zur 
Prüfung der Schritte des Datenschutzes am Ende ihres Beitrag. Dieser Beitrag soll 
damit insbesondere Studierende und Lehrende in Bezug auf den Datenschutz auf 
den aktuellen Stand bringen und zur datenschutzrechtlich konformen Forschung 
befähigen. 

Mit diesem Themenblock zum Datenschutz schließt der Sammelband ab. Wie 
durch entsprechende Verweise deutlich wurde, knüpfen die Inhalte dieses Sam- 
melbandes teilweise an grundlegende Lehrbücher und Forschungskenntnisse an 
bzw. ergänzen diese. Der Schwerpunkt der hier folgenden Beiträge liegt auf der 
Vermittlung von ergänzendem Wissen und praktischen Kompetenzen zur Durch- 
führung eigener Forschungen, mit dem Fokus auf quantitativen Methoden empi- 
rischer Sozialforschung. Die Inhalte sind dabei nicht als vollständige Auflistung 
zu verstehen, sondern als Anregungen und anwendungsorientierte Hinweise für 
die Nutzung quantitativer Daten in den genannten bildungswissenschaftlichen 
Disziplinen, deren Bedeutung und Potenziale im Rahmen des Sammelbandes ver- 
deutlicht werden sollen. Wir hoffen damit, Studierende zur Nutzung quantitativer 
Daten ermutigen und Lehrende bei der Vermittlung dazu notwendiger Datenkom- 
petenzen unterstützen zu können. 
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2.1 Methodische, methodologische und 
fachspezifische Perspektiven auf 
die Nutzung quantitativer Daten in 
bildungswissenschaftlichen Disziplinen 


Marc André Kellert, Jessica Gröber & Dirk Hofäcker 


Wie das einleitende Kapitel dieses Sammelbandes bereits verdeutlicht, ist die 
Nutzung quantitativer Daten in den hier als bildungswissenschaftliche Disziplinen 
zusammengefassten Studiengängen Soziale Arbeit, Erziehungswissenschaft und 
Lehramt, nicht immer selbstverständlich. Dies liegt zum einen in spezifischen 
methodischen Implikationen quantitativer Forschungsmethoden begründet, zum 
anderen aber auch in den damit zusammenhängenden fachlichen Besonderheiten 
und Diskursen der adressierten Studiengänge. Für die erfolgreiche Durchführung 
eigener Forschungsprojekte in den genannten Studienfächern ist es von großer Be- 
deutung, diese methodischen Implikationen und fachspezifischen Perspektiven in 
den Grundzügen zu kennen und zu reflektieren, um eine angemessene Wahl der 
Forschungsmethoden - und damit auch Daten - treffen zu können. 

Im Rahmen dieses Beitrags werden darum zunächst die fachspezifischen Per- 
spektiven der Erziehungswissenschaft, des Lehramts und der Sozialen Arbeit auf 
die Nutzung quantitativer Methoden empirischer Sozialforschung anhand der je- 
weiligen eigenen Fachhistorie sowie der fachbezogenen Forschungsthemen kurz 
erläutert. Daraufhin folgt eine Diskussion allgemeiner methodologischer und me- 
thodischer Implikationen, die mit der Nutzung quantitativer Daten einhergehen. 
Dem schließt sich eine Diskussion der Potenziale quantitativer Methoden in bil- 
dungswissenschaftlichen Disziplinen an, welche Argumente zur Nutzung dieser 
für einzelne Forschende als auch für die Disziplin anführt. Zusammengenommen 
soll der vorliegende Beitrag damit anhand ausgewählter methodischer/methodo- 
logischer und fachspezifischer Perspektiven zum einen Möglichkeiten und zum 
anderen Grenzen der Nutzung quantitativer Daten in bildungswissenschaftlichen 
Disziplinen aufzeigen, die im abschließenden Fazit noch einmal kompakt zusam- 
mengefasst werden. 
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Fachspezifische Perspektiven der Nutzung quantitativer Daten 


Um sich ein Bild davon zu verschaffen, inwieweit der Umgang mit quantitativen 
Daten und Forschungsmethoden in bildungswissenschaftlichen Disziplinen etab- 
liert ist und wie er sich in der jüngeren Vergangenheit entwickelt hat, soll an dieser 
Stelle ein kurzer historischer Exkurs erfolgen. Dieser Rückblick ist auch für heutige 
Fachdebatten relevant, da langfristige historische Entwicklungslinien sich meist 
auch in aktuellen Diskursen noch widerspiegeln. Zunächst ist dabei ein Blick auf 
die allgemeine Geschichte der Methoden empirischer Sozialforschung vonnöten, 
welche die gemeinsame Basis der wissenschaftlichen Forschung in den bildungs- 
wissenschaftlichen Disziplinen darstellt. 

Was heutzutage als empirische Sozialforschung bezeichnet wird, lässt sich ver- 
einfacht auf die Bemühungen zweier Wissenschaftler zurückführen: Adolphe Que- 
telet, welcher mit seiner „Sozialen Physik“ (1835) die Grundlage für internationale 
„Moralstatistiken“ (beispielsweise Kriminalstatistiken) legte, und Auguste Comte, 
welcher den Begriff der „Soziologie“ (1830) als „soziale Naturwissenschaft“ prägte. 
Diese Ansätze stellten die Weiterentwicklung von der klassischen Universitätsstatis- 
tik und Kameralistik dar, welche sich bereits knapp ein Jahrhundert zuvor etabliert 
hatten (vgl. Maus 2016: 5ff.). Die „Soziale Physik“ nach Quetelet stellte dabei die 
Idee dar, in Analogie zu den damals etablierten Disziplinen, „den Menschen mit na- 
turwissenschaftlichen Verfahren erforschen zu können“ und mathematisch zu er- 
fassen (vgl. Kern 1982: 38), während sich die „Soziologie“ nach Comte von einer 
rein statistischen Auswertung distanzierte und den Fokus auf andere Methoden 
(beispielsweise Beobachtung und Experimente) legte (vgl. ebd.: 46f.). Anfang des 
19. Jahrhunderts entwickelte sich aus diesen beiden Strömungen eine „quantitativ 
empirische Soziologie“, welche die historische Basis der heutigen empirischen Sozi- 
alforschung bildet (vgl. ebd.: 37-67; vgl. Maus 2016: 3-12; vgl. Jahoda 2015: 1-8). 

Diese Basis wurde durch verschiedene, im Kontext dieses Sammelbandes als 
„bildungswissenschaftlich“ bezeichnete Disziplinen, aufgegriffen. Im Folgenden 
werden einige Spezifika dieser Disziplinen mit Blick auf die quantitative Metho- 
denausbildung und Forschungsanwendung sowie deren jüngere Entwicklung seit 
den 1950er-Jahren skizziert.! 


1 An dieser Stelle muss darauf hingewiesen werden, dass die jeweiligen Disziplinen akade- 
misch nicht als homogenes Konstrukt zu begreifen sind und für sie daher keine genera- 
lisierenden Aussagen getroffen werden können. Die folgenden Ausführungen sind daher 
als vereinfacht zu betrachten und beziehen sich nur auf vereinzelte, ausgewählte Aspekte. 
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Quantitative Bildungsforschung in der Erziehungswissenschaft und den 
Lehramtsstudiengängen 


Die Historie der Bildungsforschung beginnt überwiegend in Deutschland: Ange- 
trieben von philosophischen Vorreitern wie Kant, legte sich der Fokus vor allem auf 
die Psychologie und Physiologie des Lernens. Die empirische Bildungsforschung 
institutionalisierte sich nach dem Zweiten Weltkrieg verhältnismäßig früh wieder 
in Deutschland: Während sich das Land selbst teilweise noch im Wiederaufbau 
befand, wurde bereits 1950/51 in Frankfurt am Main die Hochschule für Inter- 
nationale Pädagogische Forschung (heute: DIPF Leibniz-Institut für Bildungsfor- 
schung und Bildungsinformation) gegründet; 1963 folgte das in Berlin ansässige 
Institut für Bildungsforschung in der Max-Planck-Gesellschaft (vgl. Behm 2017: 
34ff.). Quantitative Forschungsmethoden wurden dabei von Beginn an für die Bil- 
dungs- und Schulforschung verwendet. Auch heutzutage existieren mit dem Na- 
tionalen Bildungspanel (NEPS) (vgl. Blossfeld/Roßbach 2019), den PISA-Studien 
(Programme for International Student Assessment) der OECD (vgl. OECD 2020) 
oder auch den PIRLS-Studien (Progress in International Reading Literacy Study) 
(vgl. Mullis/Martin 2015) - in Deutschland eher unter dem Namen IGLU (Interna- 
tionale Grundschul-Lese-Untersuchung) (vgl. Bos et al. 2015) bekannt - große bil- 
dungswissenschaftliche Studien mit quantitativem Schwerpunkt. Hinsichtlich der 
Forschung bestärkte das Fachkollegium „Erziehungswissenschaft“ der Deutschen 
Forschungsgemeinschaft (vgl. Stanat 2015: 75-90) 2014 die Bereitstellung und 
Nutzung quantitativer Forschungsdaten in der Bildungsforschung mit dem Ziel 
die empirische Bildungsforschung allgemein zu stärken. Sowohl die quantitative 
Bearbeitung von erziehungswissenschaftlichen Fragestellungen als auch die Repli- 
kation von Forschungsergebnissen werden als zentrale disziplinäre Chancen und 
Potenziale benannt (vgl. ebd.). 

Zusammengefasst zeigt sich, dass in der Forschungstradition der empirischen 
Bildungsforschung eine ausgeprägte quantitative Forschungsausrichtung bereits 
seit längerem vorhanden ist. 

Blickt man auf die Vermittlung von forschungsmethodologischen und -metho- 
dischen Kenntnissen in der Lehre, muss zwischen erziehungswissenschaftlichen 
Studiengängen einerseits und den bildungswissenschaftlichen Anteilen der Lehr- 
amtsstudiengänge andererseits unterschieden werden. Um die Unterschiede in der 
Methodenausbildung in den Studiengängen der Erziehungswissenschaft und des 
Lehramts beispielhaft veranschaulichen zu können, wird nachfolgend eine Studie 
von Stelter und Miethe (2019) hinzugezogen, welche sich quantitativ mit der Ver- 
breitung forschungsmethodischer Kompetenzen in Modulhandbüchern in Bache- 
lor- und Master-Studiengängen der Erziehungs-/Bildungswissenschaften und des 
Lehramts auseinandergesetzt hat. 
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Die Erziehungswissenschaft zeigt dabei ein deutlich forschungsmethodolo- 
gisch ausgerichtetes Profil: In der Lehre wiesen lediglich 17 % der Studiengän- 
ge kein dediziert forschungsmethodisches Modul auf (vgl. Stelter/Miethe 2019: 
28f.). Diese ausgeprägte Forschungsorientierung in der Lehre spiegelt sich auch 
in der Professionspolitik wider: Für die Studiengänge der Erziehungswissenschaft 
empfiehlt die Deutsche Gesellschaft für Erziehungswissenschaft (DGfE) eine quan- 
titative Methodenausbildung als Teil des Kerncurriculums (vgl. Deutsche Gesell- 
schaft für Erziehungswissenschaft 2010). 

Für die Studiengänge des Lehramtes zeichnet sich in der Studie hingegen eine 
weniger umfangreiche Verankerung einer Forschungsmethodenausbildung ab: 
Nach Stelter und Miethe (2019: 29) war in 41% der Lehramtsstudiengänge kein 
dediziertes forschungsmethodologisches Modul in der Ausbildung vorgesehen. 
Wenn forschungsmethodologische Kenntnisse in der Lehramtsausbildung vermit- 
telt wurden, so wurden jedoch sowohl qualitative als auch quantitative Methoden 
unterrichtet; auf nur eine der beiden Methoden wurde sich in diesen Fällen selten 
beschränkt (vgl. ebd.: 28ff.). Ebenfalls war die Anzahl von zu absolvierenden for- 
schungsmethodologischen Modulen in Lehramtsstudiengängen deutlich geringer 
als im Vergleich zu den anderen erhobenen bildungs- und erziehungswissenschaft- 
lich orientierten Studiengängen (vgl. ebd.: 28). Trotz der begrenzten Reichweite 
der o. g. Studie - sie umfasste nur knapp 67 deutsche Hochschulen - verdeutlichen 
die skizzierten Ergebnisse, dass forschungsmethodische Kenntnisse in Lehramts- 
studiengängen offenbar nicht weitläufig curricular auf der Modulebene verankert 
sind.? Entsprechend ist zu vermuten, dass bei Absolvent:innen forschungsmetho- 
dische Vorkenntnisse weniger fest verankert sind als bei Absolvent:innen der an- 
deren „erziehungs- und bildungswissenschaftlichen Studiengänge[]“ (ebd.: 31f., 
Auslassung durch Autor:innen). Ein derartiger Mangel mag für die Berufspraxis 
von Lehrer:innen auf den ersten Blick von geringer Relevanz sein, da für Lehrkräfte 
diese Methoden scheinbar im alltäglichen Schulbetrieb selbst kaum Anwendung 
finden. Hinsichtlich einer solchen Lesart äußert sich die empirische Bildungsfor- 
scherin Merle Hummrich jedoch sehr kritisch: 


„Wenn wir uns vorstellen, dass Studierende, die Lehrerin oder Lehrer 
werden wollen, sich keine Forschungsmethoden aneignen und damit 
keine dem Sinne nach wissenschaftlichen Studiengänge mehr absolvie- 
ren würden, dann wäre ein Hochschulstudium obsolet. [...] Dies würde 
auch bedeuten, dass wissenschaftliche Perspektiven auf das künftige Be- 


2 Die Frage, inwiefern forschungsmethodische Kompetenzen im Rahmen eines spezifischen 
Moduls querschnittlich über einzelne Module hinweg vermittelt werden, kann angesichts 
der 0.g. Studie nicht abschließend beantwortet werden. 
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rufsfeld höchstens noch gelernt, nicht aber forschend erfahren werden. 
Damit wäre die Möglichkeit der Verbindung zwischen Praxisreflexion 
und Theoriebildung aufgegeben.“ (Hummrich 2019: 68f., Auslassungen 
durch Autor:innen) 


Die Befähigung der Lehramtsstudierenden zur (empirischen) Forschung ist somit 
nicht rein als Mittel zum Zweck hinsichtlich einer eigenständigen Forschungs- 
tätigkeit, sondern auch als ein Weg zur autonomen wissenschaftlich fundierten 
Profession zu betrachten. Diesbezüglich ergänzt Hummrich: „Ein pädagogisches 
Handeln, das jedoch nicht einerseits die Möglichkeiten, andererseits die Grenzen 
der Machbarkeit mitreflektiert, läuft möglicherweise Gefahr, sich in den Dienst 
von Herrschaftsinteressen zu stellen oder selbst absolutistisch zu werden und ten- 
diert dazu, die ‚Erziehung zur Mündigkeit‘ (Adorno 1971) aufzugeben“ (ebd.: 69). 


Fachperspektive der Sozialen Arbeit 


Die Methodenausbildung, -entwicklung und -auswahl sowie die relative Bedeu- 
tung quantitativer Methoden stellte in den vergangenen Jahrzehnten für die Diszi- 
plin der Sozialen Arbeit ein relevantes und kritisch diskutiertes Thema dar. So fasst 
etwa Jakob (2002) die Situation wie folgt zusammen: 


„Bei einem Blick auf die Diskussion um Forschung und Ausbildung in 
den letzten Jahren fällt eine eindeutige Gewichtung auf. Während es 
zum Einsatz qualitativ-rekonstruktiver Methoden in der Ausbildung 
eine lebendige Diskussion gibt und mit vielfältigen neuen Ansätzen ge- 
arbeitet wird und unter dem Stichwort einer sozialpädagogischen Kasu- 
istik neue Lernarrangements entstanden sind, ist es um die Integration 
quantitativ-empirischer Verfahren in die Ausbildung still geworden. So 
haben sich im Kontext der verschiedenen Ansätze einer ‚rekonstrukti- 
ven Sozialpädagogik‘ vielfältige Konzepte und Modelle forschenden 
Lernens herausgebildet, in denen qualitativ-rekonstruktive Methoden 
gezielt für die Ausbildung der Sozialen Arbeit eingesetzt werden (vgl. 
Jakob/von Wensierski 1997). [...] Eine vergleichbare Diskussion und 
die Entwicklung neuer Ansätze lässt sich im Kontext der quantitativen 
Forschungsmethoden nicht beobachten.“ (Jakob 2002: 926, Auslassun- 
gen durch Autor:innen). 


Dabei blickt die Soziale Arbeit historisch seit dem Anfang des 19. Jahrhunderts in 
Mitteleuropa und den angelsächsischen Staaten auf eine empirische Forschungs- 
tradition unter Verwendung beider methodischer Ansätze zurück, die größtenteils 
zunächst durch Vereine der bürgerlichen Sozialreformbewegung etabliert wurde. 
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Zum methodischen Instrumentarium zählten hier neben qualitativen Erhebungen 
auch Erhebungen quantitativer Natur (mit Schwerpunkt Armut und „Volksleben‘“; 
heutzutage eher unter dem Begriff Soziale Lage vertreten) (vgl. Bromberg/Hoff/ 
Miethe 2012). Im Gegensatz zu der Erziehungswissenschaft, welche früh nach 
dem Ende des Zweiten Weltkrieges Forschungsinfrastrukturen mit passenden For- 
schungsschwerpunkten aufbaute, vollzog sich die analoge, flächendeckende Insti- 
tutionalisierung für die Soziale Arbeit hingegen erst zu einem späteren Zeitpunkt; 
sie begann erst in den 1960/70er-Jahren an den neugeschaffenen Fachhoch- 
schulen, welche für lange Zeit keinen expliziten Forschungsauftrag besaßen (vgl. 
Hammerschmidt et al. 2019: 9f.). So fehlte für einige Jahrzehnte der institutionali- 
sierte Anschluss an die empirische sozialwissenschaftliche Forschungslandschaft. 
Auch in den folgenden Jahrzehnten zeigte sich ein auffällig geringer Anteil von 
Forschungsarbeiten mit quantitativ-methodischem Schwerpunkt; im fachlichen 
Diskurs wurde überwiegend Bezug auf qualitative Forschungsarbeiten genommen 
(vgl. ebd.). Zu beobachten war somit eine gewisse Distanz zur standardmäßigen 
Anwendung von quantitativen Methoden. Diese entsprang zum einen einer Skepsis 
gegenüber einer Reduktion sozialarbeiterischen Handelns auf Wirtschaftlichkeit 
(vgl. ebd.: 14); zum anderen gab es Stimmen, welche vor einer „routinisierten Ver- 
kürzung pädagogischer Komplexität, einer Technologisierung des pädagogischen 
Bezugs“ durch quantitative Forschung warnten, da quantitativ-empirische Mess- 
ergebnisse nur einen Aspekt der professionellen Entscheidungsfindung darstellen 
dürfen bzw. sollten (vgl. Galuske 2018: 993f.). Der Fokus auf die qualitativen Me- 
thoden, welche das Ziel haben, eine möglichst sensible und tiefe Analyse durch das 
Nachvollziehen subjektiver Wirklichkeitskonstruktionen des Individuums durch- 
zuführen (vgl. Misoch 2019: 25-28), dockt dabei auch an den theoretischen Dis- 
kursen der Sozialen Arbeit mit Fokus auf den Menschen an: das Selbstverständnis 
als Menschenrechtsprofession (vgl. Staub-Bernasconi 1986), die Lebensweltorien- 
tierung (vgl. Thiersch 2014), oder dem Sozialraum (vgl. Fürst/Hinte 2020) des In- 
dividuums oder auch als kritische Auseinandersetzung mit der Profession selbst als 
Macht- und Kontrollwerkzeug der Regierung zur „Normierung“ (vgl. Kessl 2006). 
Außerhalb von Deutschland wurde diese Skepsis gegenüber den quantitati- 
ven Methoden von Forschenden der Sozialen Arbeit häufiger abgelegt: Eine Meta- 
analyse von englischsprachigen Veröffentlichungen im Fachbereich der Sozialen 
Arbeit (vgl. Guo 2015: 377) zeigte eine große Vielfalt von Studien unter Verwen- 
dung quantitativer Methoden, wobei insbesondere die Forschungsschwerpunkte 
Kindes-/Jugendschutz, Sozialleistungen und Armut sowie Gesundheit die größte 
Vielfalt von (auch komplexeren statistischen) Methoden aufwiesen. Ein Grund für 
diesen „Vorsprung“ könnte sein, dass die Soziale Arbeit im angelsächsischen Raum 
wesentlich früher als in Deutschland eine Forschungsausrichtung in eigenen Aus- 
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bildungsstätten besaß: Schon Mary Richmond (1861-1928) lehrte Methoden zu 
Vergleichsstudien, um ihre Studierenden gemeinsame zugrunde liegende soziale 
Probleme identifizieren zu lassen (vgl. Dunlap 1993: 293) und auch Edith Abbott 
setzte sich im Laufe ihrer akademischen Tätigkeit für quantitative Methoden als 
Bestandteil der Sozialen Arbeit in Lehre und Praxis ein; so lehrte sie bspw. Kurse 
wie „Methods of Social Investigations“, veröffentlichte u. A. Kriminalstatistiken und 
setzte sich als Mitgründerin und Dekanin der School of Social Service Administrati- 
on für eine größere Verwissenschaftlichung und Professionalisierung der Sozialen 
Arbeit ein (vgl. Deegan/Hill 1991: 2936). Die Soziale Arbeit in Deutschland könnte 
in ähnlicher Weise von einem Ausbau quantitativer Forschungsmethoden profitie- 
ren und sowohl Anschluss als auch Inspiration bei der bereits vorhandenen quan- 
titativen Forschung im internationalen Bereich erhalten. Der potenzielle Gewinn 
durch eine Stärkung der quantitativen Methoden(-ausbildung) in der Sozialen 
Arbeit wäre erheblich und würde die eigene Forschungslandschaft bereichern. 

In den genannten Beispielen zeigen sich zum einen die unterschiedlichen Aus- 
gangsvoraussetzungen der verschiedenen bildungswissenschaftlichen Disziplinen 
in Bezug auf die Verbreitung quantitativer empirischer Forschungsmethoden und 
-daten, zum anderen aber auch deren historisch und inhaltlich begründete, zum 
Teil kritische Perspektive auf die Verwendung dieser. Die Kritik, die in diesem Zuge 
an der Verwendung quantitativer empirischer Sozialforschung geäußert wird, ba- 
siert dabei meist auf deren methodologischen Grundannahmen und methodischen 
Implikationen, welche im Folgenden näher diskutiert werden. 


Methodologische Grundannahmen und methodische Implikationen der 
Nutzung quantitativer Daten 


Bei der Entscheidung für oder gegen die Nutzung quantitativer Daten im eigenen 
Forschungsvorhaben müssen bestimmte grundlegende methodologische und me- 
thodische Abwägungen getroffen werden. Denn mit der Nutzung quantitativer 
Daten - und natürlich auch mit der Nutzung qualitativer Daten — gehen spezifische 
Möglichkeiten und Grenzen einher. Diese betreffen u.a. das Erkenntnisinteres- 
se, grundlegende wissenschaftstheoretische Annahmen, damit verbundene For- 
schungsdesigns sowie die Möglichkeiten zur Datenerhebung, des Datenzugangs 
und der Datenauswertung. Im Zuge dieses Abschnitts werden entsprechend der 
oben genannten Aspekte derartige Möglichkeiten und Grenzen quantitativer For- 
schungsmethoden vorgestellt. 
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Erkenntnisinteresse quantitativer und qualitativer Forschungsmethoden 


Als Paradigmen der empirischen Sozialforschung verfolgen sowohl quantitative 
als auch qualitative Forschungsmethoden das Ziel der Erforschung sozialer Rea- 
lität (vgl. Häder 2019: 13). Während die qualitativen Forschungsmethoden sich 
dabei „zum Ziel gesetzt haben, das individuelle Handeln zu verstehen und es de- 
tailliert zu analysieren, sucht die zweite Art von Methoden [also die quantitativen 
Forschungsmethoden] nach verallgemeinerbaren Aussagen und nutzt dafür eine 
standardisierte Datenerhebung“ (ebd.: 14, Ergänzung durch Autor:innen). Qua- 
litative Forschungsansätze eignen sich somit insbesondere zum Nachvollzug „von 
Beweggründen, Motiven und Auswirkungen für bzw. von sozialem Verhalten, 
wobei die Individualität und Einzigartigkeit der befragten Personen respektiert 
wird“ (Schaffer/Schaffer 2020: 44), während quantitative Forschungsmethoden 
darauf ausgelegt sind, messbare quantifizierbare Daten zu erheben, meist mithil- 
fe größerer Fallzahlen, statistische Analysen ermöglichen und unter bestimmten 
Voraussetzungen den Rückschluss auf zuvor definierte Personengruppen zulas- 
sen — Stichwort Repräsentativität (vgl. Hofäcker/Stegl 2021: 61ff., 328; Richter/ 
Paier/Reiger 2021: 106f.). Im Mittelpunkt steht dabei zumeist der generalisierbare 
Erkenntnisgewinn über diese Zielgruppen und weniger das einzelne Individuum 
(vgl. Kromrey 2002: 211). Quantitative Forschungsmethoden weisen somit spe- 
zifische Stärken auf, gleichzeitig sind ihnen per definitionem aber auch Grenzen 
gesetzt; Charakteristika, die im nachfolgenden fiktiven Beispiel veranschaulicht 
werden sollen: 


Beispiel 1: 


Ein Forschungsteam möchte der Frage auf den Grund gehen, wie Jugendlichen 
in Deutschland der Übergang von der Schule in den Beruf gelingt. Die Forschen- 
den stoßen bei ihrer Recherche zunächst auf (quantitative) Daten, die beschreiben, 
wie häufig der Übergang gelingt und wie lange dieser durchschnittlich dauert.? 
Basierend auf diesen repräsentativen Daten können die Forschenden nach eini- 
gen statistischen Auswertungen außerdem einige Merkmale ausfindig machen, die 
Einfluss auf das Gelingen des Übergangs in den Beruf haben, beispielsweise die 


3 Eine eigene empirische Studie bedeutet nicht gleich, dass auch eine eigene Datenerhe- 
bung notwendig ist. Insbesondere in Hinblick auf quantitative Daten ist oft die Forschung 
mit sogenannten Sekundärdaten möglich. Die Kapitel 3.1 und 3.2 zeigen die praktischen 
Möglichkeiten dieser Sekundärdaten anhand verschiedener Beispiele auf. 
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besuchte Schulform und der sozioökonomische Hintergrund.“ Durch diese quanti- 
tativen Daten wissen sie nun statistisch belastbar, wie vielen der Übergang erfolg- 
reich gelungen ist, wie viel Zeit bis dahin vergangen ist und welche Faktoren einen 
Einfluss darauf hatten. 


Diese Quantifizierung der Situation Jugendlicher in Deutschland ermöglicht durch 
die Fokussierung auf relevante Variablen einen generalisierenden Überblick, sie 
berücksichtigt jedoch nur ansatzweise die individuelle Komplexität der Situation 
eines bzw. einer jeden einzelnen Jugendlichen. Bemühen sich nun Fachkräfte wie 
Lehrer:innen und (Schul-)Sozialarbeiter:innen um die Begleitung von Schüler:in- 
nen in den Beruf, so hilft ihnen das Wissen um Risikofaktoren, die den Übergang 
erschweren, welche aus der Statistik ersichtlich sind, zwar durchaus. Allerdings 
können im konkreten Fall weitere individuelle Gründe für einen erschwerten 
Berufsübergang vorliegen, die keineswegs außer Acht gelassen werden dürfen, 
aber quantitativ schwer zu erheben sind. An dieser Grenze der quantitativen For- 
schungsmethoden und -daten beginnen die Möglichkeiten der qualitativen. Durch 
Gespräche mit den Jugendlichen — etwa in Form qualitativer Interviews — kann ein 
breiteres und vertieftes Verständnis der individuellen Gründe für Schwierigkeiten 
im Übergang von der Schule in den Beruf entwickelt werden. Ein Beispiel findet 
sich in der Studie von Ilka Benner (2018) „Bildungsbenachteiligung und Bildungs- 
anlässe am Übergang Schule-Beruf. Eine Studie mit Fokus auf Bildung, Geschlecht 
und soziale Herkunft“. In 20 problemzentrierten Interviews mit Jugendlichen in 
einer berufsvorbereitenden Bildungsmaßnahme (BvB) geht die Autorin u.a. der 
Frage nach, ob „in der Person und ihrer (schulbezogenen) Biografie liegende Phä- 
nomene, Erfahrungen und/oder Verhaltensweisen (wie spezielle Konstruktionen 
situierter Männlichkeiten) existieren, welche die Einmündung in das Übergangs- 
system begünstigen, die gesellschaftlich als ein Scheitern an der ersten Schwelle 
wahrgenommen wird“ (Benner 2018: 173). Zwar ließen sich Motive und Beweg- 
gründe grundsätzlich auch mit einem quantitativen Fragebogen erheben - etwa in 
Form einer entsprechenden standardisierten Antwortskala —, der besondere Vorteil 
qualitativer Methoden liegt aber darin, den einzelnen Motiven näher nachgehen 
und ihren wechselseitigen Zusammenhang in den Blick nehmen zu können. Eben- 
so könnten durch eine offenere Befragungsform neue, in der bisherigen Forschung 
nicht berücksichtigte Motive einfacher „entdeckt“ werden. Sowohl qualitative als 


4 Beispiele für solche Auswertungen finden sich etwa in dem jährlichen Berufsbil- 
dungsbericht des BMBF (vgl. bspw. 2022: 28ff.). 
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auch quantitative Forschungsmethoden und Daten helfen im Rahmen ihrer Mög- 
lichkeiten und Grenzen in diesem Fall dem Fachpersonal bei der Identifikation rele- 
vanter Einflussfaktoren und damit der Unterstützung der Jugendlichen. An diesem 
Beispiel zeigt sich zugleich, warum qualitative und quantitative Forschungsmetho- 
den im Rahmen der Mixed-Methods-Debatte zunehmend als komplementär statt 
als konkurrierend betrachtet werden. 

In Bezug auf das eigene Erkenntnisinteresse liegen somit Stärken der Nutzung 
quantitativer Forschungsmethoden respektive Daten u.a. in der Möglichkeit des 
Formulierens allgemeingültiger Aussagen (Repräsentativität), der Arbeit mit ho- 
hen Fallzahlen, der Reduktion von Komplexität (Verschaffen eines Überblicks) 
sowie der systematischen Analyse von Wirkungszusammenhängen (statistische 
Analysen). Umgekehrt existieren Beschränkungen im Bereich der Tiefenanalyse 
von Individuen, deren Motiven, Erfahrungen, Biografien u.Ä. sowie insbesondere 
der Ergründung zuvor unbekannter individueller Einflussfaktoren. Einen Ansatz- 
punkt zur Milderung dieser Schwächen liefern darum Studiendesigns, die beide 
Methoden miteinander kombinieren und somit deren Stärken miteinander verei- 
nen. Neben der Reflexion des Erkenntnisinteresses ist darum auch die Aufstellung 
eines passenden Forschungsdesigns wichtig. 


Forschungsdesigns 


Wie der Begriff der empirischen Sozialforschung bereits verdeutlicht, befassen sich 
beide methodischen Ansätze — qualitativ und quantitativ — mit Empirie, also mit auf 
Erfahrungen basierenden Beobachtungen der sozialen Wirklichkeit (vgl. Bortz/ 
Döring 2016: 12). Der Empirie gegenüber steht dabei die Theorie, die vereinfacht 
als „eine Menge von Gesetzen, die in einer theoretischen Sprache formuliert sind“ 
(Kornmesser/Büttemeyer 2020: 144), definiert werden kann. Im Zuge empirischer 
Forschung kann zunächst bei der Theorie als auch bei der Empirie angesetzt wer- 
den. Das bedeutet, dass sowohl (eine) Theorie empirisch überprüft als auch aus 
empirischen Beobachtungen eine allgemeine Theorie entwickelt werden kann. 

Die Vorgehensweise quantitativer empirischer Forschungen wird dabei meist 
durch sogenannte hypothesentestende Forschungsdesigns charakterisiert. Ausgehend 
von theoretischen Annahmen werden überprüfbare Hypothesen aufgestellt, die im 
Kontext quantitativer Forschung auf ihre empirische Haltbarkeit hin überprüft wer- 
den können. In vielen Lehrbüchern sowie in der universitären Lehre findet sich die- 
ses deduktiv-nomologische Vorgehen des Kritischen Rationalismus nach Popper (1966 
[1934]) als typisches Charakteristikum quantitativer empirischer Forschungen wie- 
der. 
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„Die quantitativ orientierten Teile der Sozial- und Wirtschaftswissen- 
schaften gehen also in der Erklärung der sozialen Welt von allgemei- 
nen Theorien und Hypothesen aus, deren Gehalt (‚Wahrheit‘, die jedoch 
nicht vollständig geklärt werden kann) unter Verwendung von systema- 
tischem, methodisch kontrolliertem Vorgehen an der Empirie geprüft 
werden sollen“ (Richter/Paier/Reiger 2021: 12). 


Diese Ansicht wird dabei oft einer theoriegenerierenden bzw. induktiven Vorgehens- 
weise gegenübergestellt, welche als vermeintliches Alleinstellungsmerkmal qua- 
litativer empirischer Forschung dargestellt wird (vgl. ebd.: 15ff.). Hält man sich 
strikt an diesen wissenschaftstheoretischen Dualismus, so legen diese den qualita- 
tiven und quantitativen empirischen Forschungsmethoden Grenzen in ihren Vor- 
gehensweisen und Möglichkeiten des Erkenntnisgewinns auf. Allerdings wurden 
diese strikten Zuordnungen von Induktion/Exploration und Theoriegenerierung zu 
qualitativen Forschungsdesigns sowie von Deduktion und Hypothesentestung zu 
quantitativen Forschungsdesigns insbesondere im Zuge der Debatte um Mixed- 
Methods aufgelockert (vgl. ebd.). Explorative, theoriegenerierende Forschung ist 
somit nicht ausschließlich qualitativer Natur, hypothesentestende Forschung muss 
ebenso nicht ausschließlich quantitativ stattfinden. 

Besteht zu Beginn einer Forschung nur wenig Wissen über das zu untersu- 
chende Phänomen, so bietet sich ein exploratives — also ein erkundendes — For- 
schungsdesign an.’ Dies kann sowohl mit qualitativen als auch mit quantitativen 
oder gemischten Methoden umgesetzt werden. Als Beispiel dafür eignet sich die 
Erforschung des Phänomens der 2018 aufgekommenen Fridays-for-Future-Bewe- 
gung, die Schüler:innen auf außergewöhnliche Weise zu politischem Engagement 
und der Auseinandersetzung mit wissenschaftlicher Forschung motiviert (vgl. 
Wahlström/Kocyba/De Vydt/De Moor 2019: 6). 


5 In der Realität können ebenso Mischformen vorliegen. So kann insbesondere bei neu 
auftretenden sozialen Phänomenen trotzdem ein Bezug zu verwandten Phänomenen oder 
ihnen zugrunde liegenden Theorien hergestellt und daraus Hypothesen abgeleitet werden. 
Dennoch können darüber hinaus gleichzeitig die Besonderheiten und Alleinstellungsmerk- 
male dieser explorativ erforscht werden. Das folgende Beispiel wurde zum besseren Ver- 
ständnis vereinfacht. 
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Beispiel 2: 

Um Strukturen und Hintergründe innerhalb dieser Bewegung aufzudecken, bieten 
sich zunächst statistische Verfahren zur Deskription und explorativen Clusterung 
an, etwa anhand grundlegender soziodemografischer Merkmale (wie Geschlecht, 
Alter, politisches Interesse u.Ä.; siehe beispielsweise Cleff 2015). Auf diese Wei- 
se können Informationen wie die Anzahl der Teilnehmenden sowie deren typische 
Merkmale gesammelt werden. Im Falle der Fridays-for-Future-Bewegung legen 
Studien nahe, dass zumindest anfänglich insbesondere junge Frauen mit einem 
guten formalen Bildungshintergrund teilnahmen (vgl. Wahlström et al. 2019: 6ff.; 
Sommer/Rucht/Haunss/Zajak 2019: 11ff.). Diese gewonnenen Erkenntnisse wie- 
derum können als Ansatzpunkt für weiterführende qualitative Analysen, etwa der 
Motive der Teilnahme, genutzt oder durch diese parallel ergänzt werden. Ebenso ist 
andersherum auch eine anfängliche Erforschung der Fridays-for-Future-Bewegung 
auf Basis qualitativer Interviews denkbar, die zunächst relevante Dimensionen der 
Teilnahme aufdeckt, welche wiederum anschließend dann die Basis einer quantitati- 
ven Clusterung darstellen können. Auf diese Weise entsteht ein explorativer „Rund- 
umblick“ auf das neue Phänomen, welcher wiederum zahlreiche Anhaltspunkte für 
weiterführende Forschungen liefert. 


Mit Blick auf wissenschaftstheoretische Annahmen zeigt sich hier zunächst eine 
besondere Stärke quantitativer Verfahren in hypothesentestenden bzw. deduktiven 
Forschungsdesigns, die der vermeintlich alleinigen Stärke qualitativer Methoden 
in induktiven bzw. theoriegenerierenden Verfahren gegenübersteht. Bei genauerer 
Betrachtung zeigen sich jedoch unter forschungspragmatischen Überlegungen 
weitaus vielfältigere Möglichkeiten der Nutzung quantitativer Forschungsdesigns. 
Diese können, wie im Beispiel veranschaulicht, ebenso in Form explorativer oder 
deskriptiver Forschungsdesigns unter bedeutsamem Mehrwert eingesetzt werden, 
wo sie beispielsweise zum Aufdecken von Strukturen innerhalb neuer Phänomene 
dienen. Darüber hinaus ist auch ein explorativer Einsatz quantitativer Methoden 
im Kontext von Mixed-Methods-Designs — z.B. im Anschluss an erste qualitative 
Befunde - denkbar. 

Nach der Klärung allgemeiner methodologischer Fragen ist schließlich ein 
Blick auf die spezifischen Grenzen und Möglichkeiten quantitativer Daten in der 
praktischen Forschung notwendig: die Datenerhebung bzw. das Auffinden geeig- 
neter vorhandener Daten sowie die Datenauswertung. 
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Datenerhebung, Zugang zu Sekundärdaten und Datenauswertung 


Datenkompetenzen stellen einen wesentlichen Kern der empirischen Sozialfor- 
schung dar. Denn egal ob qualitative oder quantitative empirische Forschung: 
Beiden dienen Daten als Grundlage. Bortz und Döring (2006) beschreiben dabei 
den Unterschied der beiden Paradigmen wie folgt: „Die Menge aller Merkmals- 
messungen bezeichnet man als (quantitative) Daten einer Untersuchung. Werden 
Merkmale oder Merkmalsausprägungen verbal beschrieben, spricht man von qua- 
litativen Daten“ (ebd.: 2). Vereinfacht gesagt liegen quantitative Daten in letzter 
Konsequenz meist in Form numerischer Daten, also in Zahlenwerten, vor (vgl. Rei- 
chertz 2014: 72), während qualitative Daten üblicherweise in Textform vorliegen 
oder dahin übersetzt werden - beispielsweise im Zuge der Transkription von Inter- 
views oder der Verschriftlichung von Beobachtungen (vgl. Flick 2014: 298). Da 
die quantitative empirische Forschung das Ziel der Verallgemeinerbarkeit und Ver- 
gleichbarkeit verfolgt, ist ein recht hoher Grad an Standardisierung der Erhebungs- 
instrumente vonnöten (vgl. Reinecke 2014: 601). Die dort abgefragten Merkmale 
müssen im Sinne der Güte des Erhebungsinstruments bestimmte Kriterien erfüllen 
und gleichzeitig quantifizierbar bzw. messbar sein, was den Möglichkeitsbereich in 
der Datenerhebung bereits bestimmt. 

Im Gegensatz zur qualitativen Forschung ist eine umfassende Gesamtbe- 
trachtung des Individuums und dessen Kontextes in der quantitativen Forschung 
seltener vonnöten. Dies geht mit dem Vorteil einher, dass eine Löschung oder 
Nicht-Erhebung personenbezogener Merkmale — welche im Zuge der Anonymi- 
sierung stattfindet — nicht unbedingt mit einem für die Studie bedeutsamen In- 
formationsverlust einhergehen muss. Die Daten sind unter Beachtung ethischer 
und datenschutzrechtlicher Aspekte (siehe dazu Kap. 5) so zur Weiternutzung 
geeignet. Dies äußert sich in den breiten Möglichkeiten der Zugänge zu und Ver- 
wendung von quantitativen Sekundärdaten. In der qualitativen empirischen For- 
schung stellt die Bereitstellung von Sekundärdaten hingegen eine vergleichsweise 
größere Herausforderung dar. Eine Schwierigkeit besteht hier beispielsweise in 
der Anonymisierung qualitativer Daten, u.a. aufgrund der hohen Bedeutung der 
Kontextinformationen (vgl. Medjedovic 2008: 207f.).° In der empirischen Sozial- 
forschung stellt der Rückgriff auf Sekundärdaten somit — in Abhängigkeit von der 
Forschungsfrage — eine wichtige Möglichkeit der Nutzung insbesondere quantita- 


6 Diesem Problem widmete sich u.a. ein DFG-gefördertes Projekt, das nach dem Abschluss 
einer Machbarkeitsstudie im Jahr 2005 (vgl. Medjedovi6/Witzel 2010) und zahlreichen da- 
rauffolgenden Schritten im Jahr 2019 durch den RatSWD als Forschungsdatenzentrum für 
qualitative sozialwissenschaftliche Forschungsdaten „Qualiservice“ (https://www.qualiser- 
vice.org/de/) akkreditiert wurde. Nach eigenen Angaben umfasst dieses aktuell 22 Studien 
mit über 1.800 Interviews (https://www.qualiservice.org/de/daten-nutzen.htm!). 
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tiver Daten dar, auf die im Rahmen dieses Sammelbandes intensiver eingegangen 
wird (siehe dazu Kap. 3.1 und 3.2). 

Eine weitere Stärke quantitativer empirischer Forschung liegt in der Verarbei- 
tung großer Datenmengen und der Reduktion ihrer Komplexität (vgl. Kromrey 
2002: 210). Genau dies stellt allerdings auch eine Schwäche dieser Methoden dar. 
Zum einen verlieren quantitative Daten meist an Aussagekraft, wenn sie nicht eine 
bestimmte Fallzahl erreichen; zum anderen ist auch die sinnvolle Anwendung ei- 
niger statistischer Analyseverfahren von einer ausreichenden Fallzahl abhängig 
(siehe beispielsweise Hofäcker/Stegl 2021: 152, 328). Quantitative empirische 
Forschungen stehen somit bei der Erforschung von Zielgruppen, die nur sehr we- 
nige Personen umfassen oder deren Angehörige nur sehr schwer erreichbar sind, 
vor besonderen Herausforderungen (siehe dazu Kapitel 4). Auch im Rahmen von 
empirischen Abschlussarbeiten oder Lehrforschungsprojekten kann das Erreichen 
ausreichender Fallzahlen sowie die Ziehung vor allem repräsentativer Stichproben 
für Studierende bzw. Alleinforschende eine große Herausforderung darstellen. 

In der Datenerhebung sowie der Datenauswertung wird insgesamt deutlich, 
dass die Stärken quantitativer Methoden gleichzeitig auch deren Schwächen defi- 
nieren. So sind mithilfe numerischer Daten statistische Analysen möglich, die aber 
eben eine Messbarkeit und Quantifizierbarkeit der interessierenden Phänomene 
voraussetzen. Ebenso ermöglichen statistische Analysen verallgemeinerbare und 
vergleichbare Aussagen (ggf. repräsentative), die aber gleichzeitig — im Vergleich 
zu qualitativen Verfahren — eine höhere Fallzahl sowie idealerweise ein zufalls- 
basiertes Auswahlverfahren benötigen. Das Messinstrument zeichnet sich dabei 
durch einen vergleichsweise hohen Grad an Standardisierung aus, der jedoch 
ebenfalls den Messbereich einschränkt. 

Auch im Hinblick auf die Form der Daten erweitert die Anwendung von Mi- 
xed-Methods-Designs die Möglichkeiten zur Nutzung quantitativer Daten — vice 
versa die zur Nutzung qualitativer Daten. Bietet sich zur Erforschung einer be- 
stimmten Fragestellung beispielsweise zunächst nur die Nutzung qualitativer Me- 
thoden an, so kann dennoch im weiteren Forschungsverlauf eine ergänzende oder 
anschließende Nutzung quantitativer Methoden in Betracht gezogen werden. Die 
vorangegangenen Beispiele veranschaulichen dabei noch einmal das Potenzial 
der Kombination beider Forschungstraditionen. Da sich der nachfolgende Beitrag 
von Carsten Schröder (Kap. 2.2) explizit mit den Grenzen und Möglichkeiten von 
Mixed-Methods auseinandersetzt, wird an dieser Stelle auf eine detailliertere Aus- 
einandersetzung mit diesem Thema verzichtet. Zusammengefasst erweitert die 
Verwendung quantitativer Methoden empirischer Sozialforschung somit sui gene- 
ris oder auch in Kombination mit qualitativen Methoden den Wissensstand. Über 
diesen „Selbstzweck“ von Forschung hinaus lassen sich weitere Argumente anfüh- 
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ren, die für eine Auseinandersetzung mit quantitativen Forschungsmethoden und 
deren Vermittlung in bildungswissenschaftlichen Disziplinen sprechen. Auf diese 
Argumente soll nun abschließend eingegangen werden. 


Die Bedeutung quantitativer Forschungsmethoden in 
bildungswissenschaftlichen Disziplinen 


Warum sollen Kenntnisse in quantitativen Forschungsmethoden sowie Daten- und 
Forschungskompetenzen im oder nach dem Studium erworben werden? Diese Fra- 
ge lässt sich oberflächlich schnell beantworten: Alle Akteur:innen des Berufsfeldes 
können davon in mehrfacher Hinsicht nur profitieren. Drei zentrale Gründe möch- 
ten wir an dieser Stelle explizit aufführen (auch wenn diese Aufzählung nicht als 
erschöpfend betrachtet werden kann): 


— die Möglichkeit zur Professionsstärkung, 

— der angemessene Umgang mit den Konsequenzen des neuen Steuerungsmo- 
dells, 

— der Ausbau von beruflichen Kompetenzen und Softskills. 


Die Möglichkeit zur Professionsstärkung 


Professionalisierung kann sowohl als Entwicklung von Lai:innen zu Fachkräften 
oder Lehrenden als auch als Professionalisierung der Fachdidaktiken zur Wissen- 
schaft verstanden werden (vgl. Heitzmann/Pauli 2015: 184f.). Dabei bedingen 
diese beiden Formen von Professionalisierung sich wechselseitig: Ohne Fachkräfte, 
welche einer Tätigkeit professionell nachgehen, gibt es keine Wissenschaft, welche 
sich mit den Praxisfragen dieser Fachkräfte beschäftigen kann. Ebenso benötigt 
eine professionelle Praxis Personen mit fundierten wissenschaftlichen Kenntnissen, 
welche sie durch genau diese vorantreibt. Entzieht man einem akademischen Fach 
und den assoziierten Fachkräften den Zugang zur Forschung, entfernt man somit 
auch (einen nicht unerheblichen Teil der) Wissenschaftlichkeit der Fachtätigkeit; 
entfällt die Wissenschaftlichkeit, verbleibt die Frage, ob für diese Tätigkeit dann 
wirklich noch ein akademisches Studium notwendig ist (vgl. Hummrich 2019: 
68). Während Hummrich diesen Diskurs primär zur Stärkung der wissenschaft- 
lichen Orientierung des Lehramtes führt, zeigt sich in den letzten Jahrzehnten der 
Trend, dass auch andere Ausbildungsberufe des sozialen Sektors (beispielsweise 
die Pflegeberufe) durch methodisch-systematisches Vorgehen zunehmend akade- 
misiert werden (vgl. Wildgruber/Becker-Stoll 2011). Eine Ausbildung an akademi- 
schen Lehrstätten stellt dabei die Infrastruktur für einen Theorie-Praxis-Austausch 
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bereit, welcher den derzeitigen Wissenstand überprüft und erweitert, Forschung 
zum interdisziplinären Austausch und zur Kooperation ermöglicht, und somit eine 
vertiefte theoretische Auseinandersetzung mit den jeweiligen fachlichen Schwer- 
punkten bzw. Interessenfeldern erlaubt. Mit dieser Infrastruktur und der Anwen- 
dung sowohl quantitativer als auch qualitativer Methoden kann dann bei fachlich 
relevanten Problemstellungen eine holistische Verfahrensweise angewandt wer- 
den, welche für eine wissenschaftliche Ausrichtung erforderlich ist (vgl. Rauschen- 
bach/Thole 1998: 10-17). 


Der angemessene Umgang mit den Konsequenzen des neuen Steuerungsmodells 


Mit dem Aufkommen des Neuen Steuerungsmodells in der öffentlichen Verwal- 
tung wurden die öffentlichen und freien Träger sozialer Dienstleistungen verstärkt 
durch gesetzliche Vorgaben sowohl mit Management- als auch Controlling- 
Maßnahmen beauftragt. Treibende Kräfte für die Einführung dieser Maßnahmen 
waren die oftmals begrenzten finanziellen Ressourcen der öffentlichen Haushalte, 
Steuerungsprobleme der öffentlichen Träger und der Wandel des gesellschaftli- 
chen Umfeldes (vgl. Grohs/Bogumil 2012: 302-306). Insbesondere die Soziale Ar- 
beit wurde durch die Auswirkungen dieses „Neuen Steuerungsmodells“ beeinflusst 
und verändert: Laut Fabian Kessl erhält beispielsweise die Kinder- und Jugendhil- 
fe durch die zunehmende Ökonomisierung vier neue Kennzeichen: Manageriali- 
sierung, Kontraktualisierung, Kommerzialisierung und Privatisierung (vgl. Kessl 
2018: 1631). Nach über drei Jahrzehnten sind diese Aspekte für viele Fachkräfte in 
der Praxis zunehmend selbstverständlich; etwa in Form strikter Dokumentations- 
pflichten, von Fallpauschalen statt Gesamtfinanzierungen und von mehr unter- 
nehmerischem Risiko für die leistungserbringenden Träger. Zusätzlich zeigt sich 
durch die Implementation von Controlling-Maßnahmen der Bedarf nach evidenz- 
basierten Informationen über die Auswirkungen von Dienstleistungen. Beispiele 
hierfür sind die Anzahl von Nutzer:innen einer Dienstleistung oder der Nachweis 
messbarer (Ver-)Besserungen bei den Klient:innen anhand bestimmter messbarer 
Kriterien. Im Rahmen des zunehmenden Wettbewerbs zwischen verschiedenen — 
oftmals auch nichtöffentlichen — Trägern bilden derartige evidenzbasierte Daten 
oftmals die Grundlage der Entscheidung für (oder gegen) bestimmte Anbieter:in- 
nen sozialer Dienstleistungen. Man mag diese zunehmenden Ökonomisierungs- 
tendenzen begrüßen oder sie auch ausgesprochen kritisch betrachten. Für soziale 
Fachkräfte ist es jedoch im Diskurs mit relevanten Akteur:innen in der Praxis vor- 
teilhaft über die Vorzüge und Grenzen von quantitativen Daten(-erhebungsmetho- 
den) aufgeklärt und diesbezüglich „sprechfähig“ zu sein. 
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Aus dem gesteigerten Nachweis- und Legitimierungsdruck ergibt sich ein Be- 
darf an belastbaren Zahlen aus nachvollziehbaren Forschungs- und Evaluations- 
prozessen. Denn „Politik müsse wissen, was sie als ‚value for money‘ erwarten 
könne, Bürger müssen wissen, welche Risiken und Nebenwirkungen sie erwarten, 
Fallmanager müssen wissen, welches Programm in welchem Fall die höchste Ff- 
fektivität und Effizienz hat“ (Albus/Micheel/Polutta 2011: 243). Mit diesen neuen 
Anforderungen konfrontiert, entwickelte sich in der Sozialen Arbeit die Wirkungs- 
forschung, welche die Wirksamkeit von Angeboten in den Blick nimmt, während 
die Nutzungsforschung sich mit der Nutzung (oder auch Nicht-Nutzung) von 
Dienstleistungen befasst (vgl. Oelerich/Schaarschuch 2013). Die Anwendung von 
allzu schematischen Vorgehensweisen in der Wirkungsforschung ist dabei in der 
Sozialen Arbeit durchaus umstritten (beispielhaft Schüßler 2012; Ziegler 2012; 
Albus/Polutta 2008). So kann für Praktiker:innen nicht nur eine Verbesserung, 
sondern ebenso eine Stabilisierung der Lage eines Klienten bzw. einer Klientin 
einen Erfolg darstellen (ein:e Schüler:in kann die Schulnote stabil halten, anstatt 
auf eine schlechtere Note „abzurutschen“; ein:e Klient:in kann weiterhin suchtmit- 
telabhängig sein, ist jedoch nicht auf „härtere“ Drogen umgestiegen). Diese Szena- 
rien würden bei einer quantitativen Erhebung, die primär auf eine Verbesserung 
der individuellen Situation abzielt, jedoch fälschlicherweise eine fehlende Wirkung 
der Maßnahme/Intervention der Fachkräfte attestieren, da sich keine positive Ver- 
änderung des Ausgangszustandes eingestellt hat. Dies wiederrum verdeutlicht, 
wie relevant die Kompetenz zur Definition angemessener Ziele einer Evaluations- 
forschung sowie zur Erhebung, Auswertung und besonders der Interpretation von 
Daten zur korrekten Messung einer Wirkung ist. Nur so können Forschende die 
(politischen) Entscheidungstragenden hinsichtlich der Eignung von Interventions- 
maßnahmen und Projekten aufklären und beraten. 

Ebenso erfolgt mit der Definition erwünschter und unerwünschter Zustände 
eine starke Normierung und Bewertung individueller Lebenslagen. Auch in der 
Erziehungswissenschaft werden mitunter Erschwernisse bei der Anwendung von 
Wirkungsforschung benannt: So können beispielsweise durch inhärente kommu- 
nikative Prozesse im Lehr- und Lernprozess kaum randomisierte Kontrollstudien 
verwendet, Lernwirkungen nicht eindeutig Interventionsstrategien zugeschrieben 
werden, und auch der „Lernerfolg“ muss zuerst als ein empirisch erfassbares Kons- 
trukt „geschaffen“ werden (vgl. Schüßler 2012: 56f.). 

Diese — zum Teil sehr berechtigten — Kritiken an den zuvor diskutierten Be- 
schränkungen quantitativer Forschung schließen jedoch nicht deren fachlich reflek- 
tierte Anwendung bei Wirkungs- und Nutzungsfragen aus. Quantitative Methoden 
verbleiben für Wirkungs- und Nutzungsforschung ein angefragtes Controlling-Tool 
der öffentlichen Träger, welches durch die Fachkräfte idealerweise beherrscht und 
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an die fachlichen Spezifika ihres Feldes angepasst werden sollte, wenn es zur An- 
wendung kommt. So wäre etwa, wie bereits erwähnt, vor der Durchführung einer 
quantitativen Evaluation der Wirkungsbegriff und dessen konkrete Messung kri- 
tisch zu reflektieren. Ebenso bietet sich auch in der Wirkungs- und Nutzungsfor- 
schung zunehmend die Kombination quantitativer und qualitativer Ansätze an. 


Der Ausbau von beruflichen Kompetenzen und Soft-Skills 


In vielen Tätigkeitsfeldern der bildungswissenschaftlichen Disziplinen werden 
Fachkräfte auch in ihrem Berufsalltag mit quantitativen Daten in verschiedenen 
Formen konfrontiert. Im neunten Kapitel (88 98-103) des achten Sozialgesetzbu- 
ches (SGB VIII) wird beispielsweise die Anfertigung einer umfangreichen Kinder- 
und Jugendhilfestatistik vom Gesetzgeber als verpflichtend niedergeschrieben. 
Diese Zahlen wiederum werden in vielen professionellen Kontexten, beispielsweise 
im Jugendamt oder im kommunalen Jugendhilfeausschuss, relevant. Auch in den 
Landesjugendämtern, den Landschaftsverbänden oder in einer Referent:innenpo- 
sition spielen (Sozial-)Daten eine tragende Rolle für weitere Planungen. Ebenso 
benötigen Fachkräfte in der Schulentwicklungsplanung und (städtischen) Schul- 
ämtern quantitative Methodenkenntnisse, um ihre Prognosen angemessen gestal- 
ten zu können. Viele der (Sozial-)Daten, welche dafür notwendig sind, werden im 
Zuge der kommunalen Sozialberichterstattung erhoben, gesammelt, bereinigt und 
schlussendlich bereitgestellt. An diesen Beispielen wird deutlich, dass in vielen 
Arbeitsfeldern der bildungswissenschaftlichen Disziplinen quantitative Daten und 
der Umgang mit ihnen eine wichtige berufliche Kompetenz darstellen. Dies be- 
schränkt sich dabei nicht nur verschiedene Bereiche der Sozialberichterstattung: 
Ebenso wird die Fähigkeit, eigenständig Forschungs- und/oder Evaluationstätig- 
keiten durchführen zu können, für immer mehr Bereiche der bildungswissenschaft- 
lichen Disziplinen, so zum Beispiel in der Sozialwirtschaft, der Erwachsenen- und 
Jugendbildung oder anderen (Non-Profit-)Organisationen mit Bildungsauftrag, 
relevant. In vielen Einrichtungen fallen zusätzlich ganz- oder halbjährliche statis- 
tische Jahreserhebungen an, welche oftmals für Personal- und Bedarfsplanungen 
oder (Neu-)Verhandlungen mit Trägerorganisationen benötigt werden. Personen, 
welche erwägen, perspektivisch eine Führungsposition (Einrichtungs- oder sogar 
Sachgebietsleitung) oder Planungstätigkeit (beispielsweise im Schulamt oder der 
Sozialplanung) zu übernehmen, sollten sich daher bewusst sein, dass quantitative 
Datenkompetenz, die Fähigkeit zur geeigneten Datenerhebung sowie Kenntnisse 
des Datenschutzes hierfür entscheidende Voraussetzungen darstellen können. Da- 
rüber hinaus ermöglicht die Beherrschung von Forschungsmethoden den Zugang 
zu einer wissenschaftlichen Tätigkeit an akademischen Forschungseinrichtungen 
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und Instituten. Das Verständnis von Forschungsmethoden und -ergebnissen ist 
eine notwendige Fähigkeit, um das eigene Fachwissen zu reflektieren und damit 
einhergehend dieses Wissen in Lehre und Berufspraxis weiterzuvermitteln. 

Zusammengenommen stellt eine breite Kenntnis forschungsmethodischer 
Grundlagen sowohl für Lehrkräfte als auch für Führungskräfte in sozialen Berufen 
eine wichtige Kompetenz dar. Daraus resultiert auch eine Notwendigkeit von fun- 
dierten Kenntnissen über (quantitative) Forschungsmethoden und -daten. 


Möglichkeiten und Grenzen von quantitativen Daten in 
bildungswissenschaftlichen Disziplinen - ein (vorläufiges) Fazit 


Wie zu Beginn des Kapitels erläutert, können die genannten drei bildungswis- 
senschaftlichen Disziplinen bereits auf die Verwendung von quantitativen Daten 
zurückblicken, wenn auch mit unterschiedlicher fachspezifischer Ausprägung. Ins- 
besondere in den Bereichen der empirischen Bildungs- und Wirkungsforschung 
stellen quantitative Erhebungs- und Auswertungsverfahren etablierte Methoden 
dar, die beispielsweise die Analyse allgemein geltender Wirkfaktoren für eine de- 
finierte Zielgruppe ermöglichen. Dennoch konnten in diesem Kapitel disziplinspe- 
zifische Besonderheiten aufgezeigt werden. So wirken sich z.B. unterschiedliche 
Präferenzen für die Anwendung einer Methodenart, die curriculare Verankerung 
der Methodenausbildung und bereits bestehende Forschungsinfrastrukturen auf 
die fachspezifische Verbreitung quantitativer Forschung(-smethoden) aus. Das 
verdeutlicht u.a. die kritische Debatte um die evidenzbasierte Praxis in der So- 
zialen Arbeit, welche den alleinigen Einsatz quantitativer Methoden durchaus als 
problematisch ansieht. Ebenso zeigte ein Vergleich von Modulhandbüchern die 
unterschiedliche Bedeutung von Methoden der empirischen Sozialforschung im 
fachspezifischen Curriculum. Diese Beispiele veranschaulichen zum einen das Po- 
tenzial der Verwendung und Vermittlung quantitativer Methoden empirischer So- 
zialforschung in den genannten bildungswissenschaftlichen Studiengängen, zum 
anderen verschaffen sie zugleich einen Einblick in die zum Teil noch zurückhalten- 
de Perspektive auf die Nutzung dieser Methoden. Die Auswirkungen von Fachtradi- 
tionen gehen jedoch noch tiefer. So zeigt sich nach unserer Lehrerfahrung sowohl 
in der Sozialen Arbeit als auch der Erziehungswissenschaft und dem Lehramt, dass 
bei studentischen Projekt- und Abschlussarbeiten ein deutlicher Überhang an qua- 
litativen Methoden existiert; selbst dann, wenn quantitative und qualitative Me- 
thoden gleichwertig im Lehrplan berücksichtigt werden. Gründe dafür sind eher 
spekulativer Natur: So könnten der Respekt vor der Anwendung mathematischer 
Verfahren oder ein größtenteils selbst qualitativ forschendes Lehrpersonal erheb- 
liche Einflussfaktoren für das Auswahlverhalten von Studierenden sein. 
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Ebenso beachtenswert wie die Möglichkeiten und Grenzen, welche sich fach- 
lich-thematisch sowie fachhistorisch zur Verwendung quantitativer Daten ergeben, 
sind jene, die durch methodische und methodologische Implikationen gesetzt sind. 
Die Eignung quantitativer Methoden und Daten zur Bearbeitung einer Forschungs- 
frage hängt dabei vom eigenen Erkenntnisinteresse ab. Daraus ergeben sich ebenso 
methodische Konsequenzen für das Forschungsdesign, die Datenerhebung, den 
Datenzugang sowie die Datenauswertung. Hier wurde jedoch aufgezeigt, dass die 
impliziten Möglichkeiten und Grenzen quantitativer Forschung durch den Einsatz 
von Mixed-Methods-Designs aufgelockert werden können. Dieser Debatte nimmt 
sich Carsten Schröder im unmittelbar folgenden Beitrag „Mixed-Methods-For- 
schung als methodologische und methodische Zukunftsmusik!? — Beispiele aus der 
Sozialen Arbeit“ ausführlicher an. 

Betrachtet man die fachspezifischen Perspektiven sowie die methodischen 
und methodologischen Implikationen gemeinsam, so ergibt sich ein erstes Bild der 
Grenzen und Möglichkeiten quantitativer Daten in den genannten bildungswissen- 
schaftlichen Disziplinen. Unter Beachtung dieser sollte stets eine Eignung quan- 
titativer Methoden empirischer Sozialforschung sowie die Nutzung quantitativer 
Daten für das eigene Forschungsvorhaben mit in Betracht gezogen werden. 

Aus Sicht der Autor:innen ist insbesondere in der Lehre eine gleichwertige 
Auseinandersetzung mit beiden Forschungsparadigmen sowie deren Kombinati- 
onsmöglichkeiten von großer Bedeutung, sodass Studierende befähigt werden, die 
für ihr Forschungsvorhaben am besten geeigneten Forschungsmethoden zu nutzen 
sowie sich eigenständig im wissenschaftstheoretischen Diskurs zu positionieren. 
Denn eine fundierte wissenschaftliche Ausrichtung bildungswissenschaftlicher 
Disziplinen kann nur gelingen, wenn angehende Fachkräfte, Praktiker:innen und 
Wissenschaftler:innen einen fundierten forschungsmethodologischen Zugang be- 
sitzen (vgl. Hofäcker/Stegl 2021: 18). Dieser Zugang zeichnet sich auch dadurch 
aus, dass diese Personengruppen mit den Möglichkeiten und Grenzen in der Nut- 
zung verschiedener Forschungsmethoden vertraut sind. Die Vermittlung quantita- 
tiver Methoden empirischer Sozialforschung kann dabei zur Professionsstärkung, 
zur Evidenzbasierung der Disziplinen sowie zur Erweiterung der persönlichen 
Kompetenzen und Karrierechancen im Rahmen ihrer Möglichkeiten beitragen. 
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methodologische und methodische 
Zukunftsmusik in der Sozialen Arbeit!? 


Carsten Schröder 


1 Einleitung 


Dieser Beitrag diskutiert die Entwicklungen zur Mixed-Methods-Forschung in der 
Sozialen Arbeit. Damit wird das Ziel verfolgt, sowohl die Potenziale als auch Her- 
ausforderungen zu diskutieren, die mit Mixed-Methods-Designs verbunden sind. 
Mit Blick auf Soziale Arbeit als forschende Disziplin besitzen hier vor allem qualita- 
tive Zugänge zur sozialen Wirklichkeit eine prominente Stellung, und wenngleich 
auch quantitative Studien erkenntnisgewinnend sind, nehmen diese eine der Ten- 
denz nach nachrangige Stellung in den disziplinären Forschungszusammenhängen 
ein. Mixed-Methods-Designs als ‚drittes Paradigma‘ stellen eine alternative For- 
schungsstrategie dar, die qualitative und quantitative Methoden kombiniert, um 
verschiedene Perspektiven auf den Gegenstand zu entwerfen. 

Für diesen Zweck wird im zweiten Abschnitt Soziale Arbeit als forschende 
Disziplin verortet. Es werden ihre heterogene Forschungslandschaft und die damit 
verbundenen Herausforderungen erörtert. Im dritten Abschnitt werden die mitt- 
lerweile diversen Designformen in der Mixed-Methods-Forschung beschrieben, 
um darauf aufbauend im vierten Abschnitt zwei Beispiele aus der Sozialen Arbeit 
vorzustellen, die sowohl qualitative als auch quantitative Methoden innerhalb ei- 
nes Forschungsprojektes verwendet haben. Im fünften und letzten Punkt werden 
die Hürden und Hindernisse sowie die Möglichkeiten und Potenziale der Mixed- 
Methods-Forschung sowohl allgemein als auch spezifisch im Hinblick auf Soziale 
Arbeit diskutiert und eine kritische Perspektive dargestellt. 


2 Soziale Arbeit als forschende Disziplin 


Wissenschaftliche Tätigkeiten sind darauf ausgerichtet, über ,,Theoriebildung und 
Forschung“ (Lüders/Rauschenbach 2005: 562) Erkenntnisse zur „Erzeugung ge- 
neralisierten systematischen Wissens“ (ebd.) zu generieren. Forschung meint in 
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diesem Zusammenhang „die systematische, d.h. theoretisch und methodologisch 
begründete und überprüfbare Beobachtung, Beschreibung und Rekonstruktion ge- 
sellschaftlicher Ausschnitte der Wirklichkeit auf der Basis sozialwissenschaftlicher 
Erhebungs- und Analyseverfahren“ (ebd.). In diesem Sinne sind Theoriebildung 
und Forschung aufeinander verwiesen und als komplementäre Bestandteile des 
Erkenntnisprozesses zu verstehen, da „Forschung letztendlich immer auf Theo- 
riebildung“ (ebd.) abzielt. Aufgrund der heterogenen Strukturen in der Sozialen 
Arbeit - sowohl in ihren Praxis- als auch in ihren Forschungsfeldern - muss jedoch 
festgehalten werden, dass Abgrenzungsschwierigkeiten auftreten, wenn man „die 
Zugehörigkeiten und Grenzen der Disziplin“ (ebd.) beschreiben will. Lüders und 
Rauschenbach (2005) verweisen darauf, dass 


„sich zeigen [lässt], dass sozialpädagogische Wissenschaftlerinnen und 
Wissenschaftler in einer Vielzahl von Forschungsfeldern, z.B. der Ju- 
gendforschung, tätig sind, ohne dass es von der Sache her nahe liegen 
würde, für diese Forschung das Adjektiv „sozialpädagogisch“ zu ver- 
wenden. Und schließlich gibt es eine Reihe von Untersuchungen, die 
man durchaus zur sozialpädagogischen Forschung zählen könnte, die 
aber weder von Sozialpädagoginnen und Sozialpädagogen noch im en- 
geren Zusammenhang der Disziplin Sozialpädagogik entstanden sind“ 
(ebd.). 


Forschung in der Sozialen Arbeit als ‚genuine’ sozialarbeiterische/sozialpädagogi- 
sche Forschung zu bestimmen, „in Bezug auf 


— einen spezifisch sozialpädagogischen Gegenstandsbereich und spezifisch so- 
zialpädagogische Fragestellungen“ (Oelerich/Otto 2011: 10), 

- „eine eigenständige Forschungskultur“ (ebd.) 

— und in Bezug auf die „Frage nach explizit sozialpädagogischen Forschungsme- 
thoden und Forschungsmethodologie“ (ebd.) 


ist von diesem Standpunkt aus gedacht ein schwieriges Unterfangen. 

So folgt dem, was als Forschung in und aus der Sozialen Arbeit heraus zu 
verstehen ist, ein gewissen Pragmatismus, wie Winkler und ebenso Schefold an- 
merken, denn eine als sozialpädagogisch relevante Forschung muss als solche 
kenntlich gemacht bzw. als solche behauptet werden (vgl. Winkler 2005: 18; 
Schefold 2012: 1123). Winkler stellt diesbezüglich fest: „Bei allem systematischen 
Unbehagen fehlen brauchbare Alternativen zu einem solchen Pragmatismus, all- 
zumal andere Disziplinen kaum anders verfahren, gleich ob sie den Natur-, den 
Geistes- oder den Sozialwissenschaften zugerechnet werden“ (Winkler 2005: 18). 
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Dies macht die Aufgabe jedoch nicht einfacher, eine Kohärenz in der Forschungs- 
kultur ausfindig zu machen, was aufgrund der „Unterschiedlichkeit der Interessen 
und Strömungen oder Kontexte in der Sozialen Arbeit“ (Oelerich/Otto 2011: 10) 
wenig überraschend ist. Als Disziplin hat Soziale Arbeit entlang historischer Dyna- 
miken ein sozialwissenschaftliches Profil entwickelt, sodass sie sich innerhalb ihrer 
empirischen und theoretisierenden Perspektivierungen an „allgemeinen Standards 
sozialwissenschaftlicher Forschung“ (ebd.) orientiert. Insofern besteht ein breiter 
Konsens darüber, dass es keine ‚genuinen‘ Forschungsmethoden Sozialer Arbeit 
gibt. Von daher stellt sich die Frage, wie Forschung als Forschung in und aus der 
Sozialen Arbeit heraus markiert werden kann. Schefold versteht in diesem Zusam- 
menhang unter Forschung „die wissenschaftliche, d.h. methodisch kontrollierte, 
nachprüfbare und nachvollziehbare Erzeugung von Wissen über die soziale Wirk- 
lichkeit [...], die für Soziale Arbeit bedeutsam ist“ (2012: 1123). Hierbei lässt sich 
das Forschungsfeld Sozialer Arbeit im Kontext der Gegenstandsbestimmung weiter 
konkretisieren: „[...] anhand von drei Eckpunkten, nämlich Institution, Profes- 
sion und AdressatInnen Sozialer Arbeit“ (ebd.; siehe auch Lüders/Rauschenbach 
2005: 565ff.). Oelerich und Otto (2011) betonen die Notwendigkeit, die benann- 
ten Dimensionen um zwei weitere zu ergänzen: zum einen um die Frage nach der 
„gesellschaftlichen Funktion“ (ebd.: 10) Sozialer Arbeit, zum anderen um die des 
„Wissenschaftscharakter[s] von Sozialarbeit/Sozialpädagogik“ (ebd.). 

Damit verbunden ist ein Verständnis von Forschung in der Sozialen Arbeit, 
das sich als ein offenes und nicht ganz eindeutig abschließendes Forschungsfeld 
beschreiben lässt. Empirische Erkenntnisse aus dem Feld der Kindheitssoziologie, 
die sich mit dem Alltagsleben von Kindern und deren Familien befassen, können 
für sozialarbeiterische Forschungsvorhaben eine Relevanz besitzen, obgleich die 
Studien eine (kindheits-)soziologische Fundierung haben. Durchaus aber können 
auch als sozialpädagogisch markierte Studien grundlegende Erkenntnisse für die 
Kindheitssoziologie beinhalten. Dieser Umstand drängt dazu, dass Soziale Arbeit 
als forschende Disziplin in einer trans- oder interdisziplinären Logik gedacht wer- 
den muss, um der Komplexität gesellschaftlicher Widerspruchsverhältnisse gerecht 
werden zu können, die von der Disziplin geradezu einfordert, eben auch solche Er- 
kenntnisse miteinzubeziehen, die nicht unbedingt ein sozialpädagogisches Profil 
umfassen. 

Dies macht aber auch deutlich, dass Soziale Arbeit als forschende Disziplin „im 
Prozess der Auseinandersetzung mit den ihr zugewiesenen bzw. aufgegriffenen 
Problemen auf viele Themen und relevante wissenschaftliche Wissensbestände 
[stößt], denen gegenüber sie sich nicht abschließen kann“ (Schefold 2012: 1124). 
In einer Theorieperspektive, die auf die Forschungslandschaft Sozialer Arbeit 
blickt, kommen Oelerich und Otto (2011), Winkler (2005) und Schefold (2012) 
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letzten Endes zu ähnlichen Ergebnissen, dass Forschung in der Sozialen Arbeit über 
ein unabschließbares kritisches Selbstbewusstsein verfügen muss, sie sich dadurch 
mit der „Aufgabe der Dauerreflexion ihrer Strukturen und Inhalte“ (ebd.: 1123) 
konfrontiert sieht, um charakterisieren zu können, was in einer gegebenen gesell- 
schaftlichen Situation Forschung in und aus der Sozialen Arbeit heraus sein kann. 
Was in jedem Fall unbestritten ist, ist die Tatsache, dass sich in den letzten Jah- 
ren eine Entwicklung abzeichnet, in der sich konstatieren lässt, dass Forschungs- 
projekte, beispielsweise im Rahmen der Graduiertenkollegs, von DFG-Projekten 
etc., die das Feld Sozialer Arbeit berühren, quantitativ gesehen stetig zunehmen 
(vgl. Oelerich/Otto 2011: 9). „Diese Intensivierung fördert die notwendige Wis- 
senschaftsbasierung einer professionalisierten Sozialen Arbeit und ermöglicht, in 
ihrem sozialwissenschaftlich orientierten Anspruch viele zuvor eher tradierte denn 
systematisch begründete Vorgehensweisen entweder empirisch zu fundieren oder 
zu überwinden“ (ebd.). 

Vor diesem Hintergrund haben sich innerhalb der sozialwissenschaftlichen 
Orientierung, aus einer historischen Perspektive betrachtet, im deutschsprachigen 
Raum vor allem qualitative Forschungsansätze in der Sozialen Arbeit etablieren 
können. Wenngleich ein zunehmendes Interesse und ein Bedarf an quantitativen 
Studien formuliert werden, so überwiegen doch in der Mehrzahl qualitative Zu- 
gänge. In diesem Zusammenhang finden sich vereinzelt Studien, die einen Mixed- 
Methods-Ansatz nutzen und eine systematische Kombination von sowohl qualitati- 
ven als auch quantitativen Methoden in ihrem Forschungsdesign einbetten. Mixed- 
Methods-Designs jedoch verfügen zum jetzigen Standpunkt nicht über eine solche 
Prominenz wie die monomethodischen Zugriffe auf soziale Wirklichkeiten im Feld 
Sozialer Arbeit. 

Um zu diskutieren, welche Potenziale und Grenzen Mixed-Methods-Ansätze 
in der Sozialen Arbeit innehaben, werden diese im Folgenden vorgestellt und un- 
terschiedliche Designformen diskutiert, um darauf aufbauend in einem nächsten 
Schritt Studien mit Bezug zur Sozialen Arbeit vorzustellen. 


3 Forschungsdesigns im Mixed-Methods-Ansatz 


Mixed-Methods-Ansätze beschreiben die systematische Verwendung qualitativer 
und quantitativer Methoden innerhalb eines Forschungsprojektes. Hierbei stellt 
sich die Frage, was mit ‚mixed‘ in Mixed-Methods-Studien genau gemeint ist. Vor 
diesem Hintergrund sollen die mit Mixed-Methods verbundenen Designformen 
vorgestellt und diskutiert werden. Da ich mich auf die Designformen beschränke, 
bleiben Debatten zum Sampling und der Datenanalyse weitestgehend außen vor. 
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Das Ziel der nun folgenden Überlegungen ist darauf gerichtet, das zentrale Charak- 
teristikum von Mixed-Methods-Studien herauszustellen. 

Ich selbst verstehe mich als qualitativer Forscher, der nunmehr in einem Sam- 
melband zu Wort kommt, in dem vor allem quantitative Methodologien und Me- 
thoden diskutiert werden. So ist mein methodologischer Standort damit bereits 
mitbenannt, den ich nicht verbergen kann und auch nicht möchte. Mich lässt die 
Schlussfolgerung Max Webers nachdenklich stimmen, dass, um ein vertiefendes 
Verstehen in der Untersuchung des Forschungsgegenstands zu ermöglichen, sich 
die Forschungshaltung danach richten muss, dass der Gegenstand den Forschen- 
den die Aufgabe aufgibt, wie er zu erforschen ist, was sich dann in der Konsequenz 
gedacht auch in einer Pluralität der Verwendung von methodischen Zugängen 
widerspiegeln muss (vgl. Kruse 2015: 45). Zur Wahl stehen der Sozialforschung 
sowohl quantitative als auch qualitative Methoden, um den zu erforschenden Ge- 
genstand mit den Mitteln und Instrumenten der Forschung zum Sprechen zu brin- 
gen. Hier könnte man nun meinen, dass die Sache eigentlich klar ist, denn es geht 
um Wissenschaft und Forschung, die an der Sache ein Interesse an der Erkennt- 
nisgewinnung hat. In diesem Zusammenhang ist mit der Verwendung von sowohl 
qualitativen als auch quantitativen Methoden das Ziel verbunden, den analytischen 
Blick schärfen, um der „Komplexität heutiger Forschungsfragen“ (Kuckartz 2014: 
29) gerecht zu werden. Doch wird auch in der Sozialforschung Politik betrieben, 
und es ist eben diese Politik, die, historisch betrachtet, den sozialwissenschaftlich 
Forschenden über Jahre hinweg eine Debatte um das ‚richtige‘ Paradigma in der 
Forschung beschert hat. Wenngleich der Paradigmenstreit beigelegt wurde, findet 
man zudem heute noch so manche polemische Spitze, die das jeweils andere La- 
ger abqualifiziert. Und so betrachtet prägt die historische Erbschaft dieser trans- 
disziplinären Wissenschafts- und Forschungspolitik die Beziehungen zwischen 
‚den Quantitativen‘ und ‚den Qualitativen‘ auch gegenwärtig noch (vgl. Baur et al. 
2017: 9). 

Der Mixed-Methods-Ansatz als forschungsstrategisches Instrument wissen- 
schaftlicher Erkenntnisgenerierung wird in den internationalen Debatten — und 
ebenso hierzulande - als,drittes Paradigma‘bezeichnet, in dem systematisch sowohl 
qualitative als auch quantitative Methoden miteinander kombiniert werden (vgl. 
ebd.: 5). Für diesen Forschungsansatz wäre es demnach hinderlich, sich darüber zu 
streiten, was nun die richtige Methodologie und Methode ist, sondern vielmehr ist 
die Perspektive eher davon geprägt, wie entlang methodologischer Vorüberlegun- 
gen der Gegenstand an welchen Schnittstellen der Studie mit welchen Methoden 
untersucht werden kann, um ein „erweitertes und vertieftes Verstehen zu ermögli- 
chen“ (Cloos et al. 2012: 248). Hiermit verbunden ist eine Abgrenzung zum Begriff 
der Triangulation, der insbesondere von Norman Denzin (1970) geprägt und im 
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deutschsprachigen Raum von Uwe Flick (2011) und Udo Kelle (2008) aufgegriffen 
wurde. Triangulation beschreibt die Anwendung von unterschiedlichen Methoden 
im Allgemeinen, sodass damit sowohl die Kombination von quantitativen und qua- 
litativen als auch zwei qualitativen oder quantitativen Verfahren mit bezeichnet 
wird (vgl. Baur et al. 2017: 5). 

Wer von Mixed-Methods spricht, meint damit, dass in einer Studie qualitative 
und quantitative Methoden verwendet sowie in Relation zueinander gesetzt wer- 
den (vgl. Cloos et al. 2021, S. 248) - und streng genommen wäre dieser Ansatz 
nach Baur et al. (2017: 5) eine Form der Triangulation, der sich begriffshistorisch 
als leitender Terminus technicus jedoch nicht durchsetzen konnte. Wenn man sich 
allerdings fragt, wie qualitative und quantitative Methoden innerhalb eines For- 
schungsvorhabens aufeinander bezogen werden können, ist damit ein Nachdenken 
über die Integrationspunkte verknüpft. Sich vorab über das strategische Vorgehen 
Gedanken zu machen, ist deshalb notwendig, da die methodischen Logiken diffe- 
rent sind und sich als konflikthaft und widersprüchlich für den Forschungsprozess 
erweisen können. Das heißt im Umkehrschluss: Mixed-Methods-Ansätze sind an 
Voraussetzungen geknüpft, um eine angemessene Form der Kombination finden zu 
können. Schoonenboom und Johnson (2017: 115) stellen heraus, dass der „point 
of integration“ markiert werden muss, da dies eine Bedingung für Mixed-Methods- 
Studien darstellt. Sie beschreiben damit zugleich die strategischen Vorgehens- 
weisen, wie qualitative und quantitative Relationierungen vorgenommen werden 
können. Sie beziehen sich hier auf die Überlegungen von Morse und Niehaus 
(2009) und erläutern zwei Möglichkeiten der Integration: zum einen den ‚results 
point of integration‘: „Most commonly, integration takes place in the results point 
of integration. At some point in writing down the results of the first component, 
the results of the second component are added and integrated“ (Schoonenboom/ 
Johnson 2017: 115). Ein anderer Integrationspunkt wird mit dem ‚analytical point 
of integration’ beschrieben: 


„In the case of an analytical point of integration, a first analytical stage 
of qualitative component is followed by a second analytical stage, in 
which the topics identified in the first analytical stage are quantitized. 
The results of the qualitative component ultimately, and before writing 
down the results of the analytical phase as a whole, become quantitati- 
ve; qualitizing also is possible strategy, which would be the converse of 
this.“ (ebd.)! 


1 Schoonenboom und Johnson verweisen hierbei auch auf andere konzeptionelle Überle- 
gungen des ‚mixing‘: „Other authors assume more than two possible points of integration: 
Teddlie and Tashakkori (2009) distinguish four different stages of investigation: the con- 
ceptualization stage, the methodological experimental stage (data collection), the analyti- 
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Die ‚points of integration‘ sind grundlegend dafür, wie das Forschungsdesign 
entworfen wird. Schoonenboom und Johnson (2017) erörtern unterschied- 
liche Designmöglichkeiten für Mixed-Methods-Studien und lehnen sich an die 
Überlegungen von Teddlie und Tashakkori (2009) an. 


Das parallele Mixed-Methods-Design basiert darauf, dass innerhalb des For- 
schungsvorhabens zwei oder mehrere parallele quantitative und qualitative 
Verfahren zur Anwendung kommen, die zeitlich entweder mit einem geringen 
Abstand oder gleichzeitig erfolgen. Die Ergebnisse der Untersuchung werden 
in die abschließenden Schlussfolgerungen integriert, denen separate Analysen 
vorangegangen sind (vgl. Schoonenboom/Johnson 2017: 118). 

Bei sequenziellen Mixed-Methods-Designs werden — wie der Name bereits andeu- 
tet — die methodischen Verfahrensweisen chronologisch — und insofern zeitlich 
nacheinander - organisiert. Ob qualitative oder quantitative Vorgehensweisen 
zur Anwendung kommen, ergibt sich aus dem vorhergehenden Arbeitsprozess 
bzw. hängt davon ab oder baut darauf auf. Die für die Untersuchung relevan- 
ten Forschungsfragen werden miteinander verbunden und/oder folgen einer 
emergenten Logik (vgl. ebd.). 

Das Konversions-Mixed-Design — oder Konversionsdesign — beschreibt eine 
transformative Strategie, die davon ausgeht, dass eine Art von Daten in die 
andere Art transformiert und daran anschließend analysiert wird. So könnten 
beispielsweise qualitative Interviews nicht nur mit qualitativen Auswertungs- 
methoden bearbeitet, sondern auch mittels quantitativer Logiken betrachtet 
werden - z.B. auszählen, wie oft ein bestimmter Begriff im Interview benannt 
wurde. Die daraus gewonnenen Erkenntnisse erzeugen eine komplexe Dimen- 
sionalisierung, die sich bildlich gesprochen sukzessive um die Forschungsfrage 
herum formieren — und insofern einer integrativen Strategie folgen (vgl. ebd.). 
Das Mehrebenen-Mixed-Methods-Design umfasst mehrere Analyseebenen, die 
sowohl parallele als auch sequenzielle Vorgehensweisen beinhalten, indem 
quantitative und qualitative Daten analysiert und integriert werden, um über 
Gemeinsamkeiten oder Kontraste vertiefende Verstehensprozesse zu ermögli- 
chen. Das Mehrebenendesign beschreibt, dass der Forschungsgegenstand auf 
unterschiedlichen Ebenen (Ebene der Organisation, der Fachkräfte oder Nut- 
zer:innen) untersucht wird und hierbei qualitative und quantitative Methoden 
miteinander kombiniert werden (vgl. ebd.). 
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— Indem voll integrierten Mixed-Methods-Design erfolgt die Kombination in allen 
Phasen der Studie auf interaktive Weise. In jeder Phase beeinflussen die Erhe- 
bung und Analyse der Daten das weitere Vorgehen, sodass sowohl mehrere als 
auch vielseitige methodische Umsetzungsprozessen stattfinden. Anstatt bei- 
spielsweise die Integration nur in der Phase der Erkenntnisse/Ergebnisse oder 
nur Phasen in einem sequenziellen Design zu integrieren, könnte eine Vermi- 
schung in der Konzeptionsphase erfolgen: in der methodischen Phase, in der 
Analysephase und in der Schlussfolgerungsphase (vgl. ebd.). 


Diese grundlagentheoretischen Darstellungen bilden den Ausgangspunkt dafür ab, 
um im Folgenden die Kombination qualitativer und quantitativer Methoden in der 
Sozialen Arbeit zu diskutieren. Ein Schwerpunkt liegt hierbei auf die Darstellung 
von Studien, die Mixed-Methods-Designs verwenden. Im Kern deuten die Studien 
auf die Möglichkeiten hin, die mit diesem forschungsstrategischen Vorgehen für 
Soziale Arbeit als forschende Disziplin in Verbindung stehen. 


4 Kombination von qualitativen und quantitativen Strategien - 
Beispiele aus der Sozialen Arbeit 


Einleitend soll hier der Argumentationspfad aus den abschließenden Bemerkun- 
gen in Abschnitt 2 noch einmal aufgenommen werden, dass der Tradition nach in 
der Sozialen Arbeit vor allem qualitative Studien in der Forschungslandschaft eine 
starke Präsenz einnehmen. Ohne hier nun eine numerische Evidenz zu präsentie- 
ren, wohl aber auf der Grundlage von Beobachtungen, möchte ich die These for- 
mulieren, dass auf Hochschulebene die Professor:innen im Feld Sozialer Arbeit vor 
allem in qualitativen Methoden ausgebildet sind und dies sicherlich auch Einfluss 
nimmt auf die Methodenausbildung im wissenschaftlichen Nachwuchsbereich. 
Demgegenüber finden sich in der Sozialen Arbeit eher wenige Professuren, die ein 
quantitativ forschendes Profil haben und im disziplinären Diskurs präsent sind. 
Gleichwohl ist hier der in Abschnitt 3 erwähnte Aspekt bedeutsam, dass die me- 
thodischen Zugriffe gegenstandsangemessen sein müssen, um die forschungsstra- 
tegischen Vorgehensweisen festzulegen. Mixed-Methods-Ansätze umfassen eine 
vielschichtige Einbettung methodischer Vorgehensweisen, die ein vertiefendes 
Verstehen zur Bearbeitung komplexer Forschungsfragen ermöglichen. Dies möchte 
ich anhand der Rezeption von zwei Mixed-Methods-Studien in der Sozialen Arbeit 
konkretisieren: 

Seraina Müller-Luzi und Marc Schmid (2017) befassen sich mit Gelingensfak- 
toren und Stolpersteinen in der Kooperation zwischen Sozialpädagogik sowie Kin- 
der- und Jugendpsychiatrie/-psychotherapie (KJPP) in der Schweiz. Sie beziehen 
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sich — erstens — auf subjektive Sichtweisen sozialpädagogischer Fachkräfte und — 
zweitens — auf Kooperationsverhältnisse in stationären Hilfesettings der Jugend- 
hilfe und psychiatrischen Kliniken. Zum einen stellen sie die Notwendigkeit einer 
interdisziplinären Zusammenarbeit heraus, dass beide Professionen ein Interes- 
se an der fachlichen „Versorgung und Sicherung der Teilhabe von psychisch und 
psychosozial belasteten Kindern und Jugendlichen“ (2017: 577) haben. Sie pro- 
blematisieren zum anderen, dass sich beide Systeme damit schwertun, „sich auf 
eine gemeinsame Falldefinition zu einigen“ (ebd.), sodass sie aus ihrer je spezi- 
fischen Professionsperspektive auf die Kinder und Jugendlichen blicken und die 
Möglichkeiten in der Ausgestaltung der Zusammenarbeit nicht ausschöpfen (vgl. 
ebd.). Sie legen einen komplexen Fragekatalog an, mit dem im Kern beabsichtigt 
wird, danach zu fragen, wie die KJPP aus Sicht der Sozialpädagog:innen wahr- 
genommen wird, mit dem Ziel, auf Verbesserungspotenziale in der interdiszipli- 
nären Zusammenarbeit hinzuweisen (vgl. ebd.: 583). In diesem Zusammenhang 
erfragen sie bei den sozialpädagogischen Fachkräften die Schnittstellen des Kon- 
takts der beiden Institutionen, die Zufriedenheit mit den konkreten Angeboten 
der KJPP, Wertschätzung der Zusammenarbeit und Veränderungswünsche (vgl. 
ebd.). Der Mixed-Methods-Ansatz basiert auf einem parallelen Design, in dem die 
quantitativen und qualitativen Daten unabhängig voneinander erhoben und aus- 
gewertet sowie im Anschluss daran die Ergebnisse miteinander verglichen wer- 
den (vgl. ebd.: 585). Sie begründen die Wahl der Methodenkombination damit, 
dass dadurch Aussagen möglich sind, um Verbesserungen in der Zusammenarbeit 
ausloten zu können, sodass auf dieser Grundlage Vorschläge für interdisziplinär 
angelegte Kooperationsmöglichkeiten formuliert werden können (vgl. ebd.). In 
der quantitativen Stichprobe erfolgte die Auswertung des Fragebogens anhand 
von Häufigkeitstabellen, die mittels SPSS® ausgewertet wurden. Die qualitativen 
Daten wurden mithilfe eines leitfadengestützten Interviews erhoben und mit der 
qualitativen Inhaltsanalyse nach Kuckartz ausgewertet. Hierfür nutzen Müller-Luzi 
und Schmid das Textanalyseprogramm MAXQDA® (vgl. ebd.). 

Die Ergebnisse der Studie veranschaulichen, welche positiven Aspekte in der 
Zusammenarbeit von sozialpädagogischen Fachkräften hervorgehoben, aber auch 
welche Schwierigkeiten wahrgenommen werden. Interessant ist, dass in der Dar- 
stellung der Ergebnisse die quantitativen und die qualitativen Erkenntnisse eine ge- 
meinsame Sprache sprechen und sich ergänzen, sodass den Leser:innen einerseits 
die numerische Verteilung und andererseits die sprachlichen Positionierungen 
sozialpädagogischer Fachkräfte aus den Interviews ein ganzheitlich(er)es Bild er- 
möglichen. Ein Widerspruch der Paradigmen ist hier nicht erkennbar, sondern viel- 
mehr ein Synergieeffekt sichtbar. Die numerische Verteilung gibt einen Überblick, 
wie Fachkräfte die Zusammenarbeit mit der KJPP bewerten. Die sprachlichen 
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Positionierungen umgreifen die Vielfalt subjektiver Perspektiven und ermöglichen 
einen differenzierten Einblick, was konkret die Fachkräfte an der Zusammenarbeit 
wertschätzen bzw. problematisieren. 

Eine zweite Studie, die hier diskutiert werden soll, ist die von Christoph Gille 
und Birgit Jagusch (2019), die sich mit der Neuen Rechten in der Sozialen Arbeit 
in Nordrhein-Westfalen (NRW) befasst. Zum einen greifen sie auf, wie rechtsextre- 
me Gruppen Einfluss auf die Angebote Sozialer Arbeit nehmen, beispielsweise im 
Feld der Kinder- und Jugendarbeit (vgl. ebd.: 1). Zum anderen deuten sie aber da- 
rauf hin, dass Soziale Arbeit empfindsam ist für rechtsextreme Positionierungen: 
„Wenn neurechte oder auch rechtsextreme Konzepte gesellschaftlich Einfluss ge- 
winnen, kann die Soziale Arbeit davon nicht unberührt bleiben. Insbesondere ma- 
chen aber die Bezüge auf das Gesellschaftliche, die Normalisierungsfunktion und 
das immanente Othering die Soziale Arbeit für Anschlüsse an neurechte Denkfigu- 
ren und Interventionen empfänglich“ (Gille/Jagusch 2019: 21). Im Fokus steht die 
Fragestellung, ob und welchen Einfluss die Neue Rechte auf Soziale Arbeit in NRW 
hat. Die Autor:innen der Studie verwenden dafür einen Mixed-Methods-Ansatz, in 
dem eine sequenzielle Logik enthalten ist. Sie begründen die Kombination qua- 
litativer und quantitativer Daten damit, dass es an grundlegenden Studien fehlt, 
sodass sie mit ihrer Untersuchung beabsichtigen, eine umfassende Grundlage zu 
schaffen, um Kenntnisse zu generieren, die „über Vorkommen und Einflussnahme 
der Neuen Rechten“ (ebd.: 25) aufklären. Die quantitativen Daten wurden mit- 
tels standardisierter Fragebögen erhoben, die an Fachkräfte in der Sozialen Arbeit 
adressiert waren. Grundlage für die quantitative Auswertung bildeten 377 Frage- 
bögen, die mithilfe von SPSS ausgewertet wurden. Perspektivisch wurde damit das 
Ziel verfolgt, sowohl Themen als auch Felder ausfindig zu machen, die dann im 
Anschluss daran durch qualitative Strategien vertiefend untersucht wurden (vgl. 
ebd.). Hierfür wurden 38 Expert:inneninterviews mit professionell Handelnden 
aus unterschiedlichen Arbeitsfeldern Sozialer Arbeit durchgeführt (vgl. ebd.: 38). 
Dazu wurde ein Interviewleitfaden verwendet, der auf Kategorien basiert, die aus 
der quantitativen Analyse heraus entwickelt wurden (vgl. ebd.: 29). Daran an- 
schließend wurde eine Dokumentenanalyse durchgeführt, die sich mit parlamen- 
tarischen Anfragen befasst hat und sich auf politische Strategien und Aktivitäten 
der Neuen Rechte beziehen, um Einflussnahmemöglichkeiten auf die Angebote 
Sozialer Arbeit zu identifizieren (vgl. ebd.: 30). 

Die Ergebnisdarstellung zeichnet sich durch eine methodische Vielfalt aus 
und schließt die professionellen Handlungsrahmungen von Fachkräften sowohl 
in der Sozialen Arbeit als auch im politischen Diskursraum in die Analysen mit 
ein. Der Analyseprozess wird als zirkulär beschrieben und orientiert sich an dem 
aus der Grounded Theory stammenden Diktum der theoretischen Sättigung (vgl. 
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ebd.: 32). Die unterschiedlichen Datenquellen weisen darauf hin, dass die Neue 
Rechte sich Strategien auf unterschiedlichen Ebenen innerhalb der Gesellschaft 
zunutze zu machen sucht, um eine Präsenz zu erzeugen, mit dem Ziel, dass rechts- 
extreme Positionen ‚an Boden‘ gewinnen. Wenngleich die Studie konstatiert, dass 
keine breite Landnahme durch die Neue Rechte behauptet werden kann, so deu- 
tet dies jedoch darauf hin, dass politische Bemühungen der Neuen Rechten dar- 
auf hinwirken, sich auch im Kontext Sozialer Arbeit einen Raum zu erarbeiten, um 
rechtsextreme Inhalte weiterzutragen (vgl. ebd.: 103). Auch hier sind keine Wider- 
sprüche zwischen den methodischen Vorgehensweisen zu verzeichnen, sondern 
vielmehr ist ein Zugewinn feststellbar, der es den Forschenden ermöglicht, ihre Er- 
gebnisse über vielfältige Wege präsentieren zu können. 

Neben der Darlegung der Möglichkeiten soll nun abschließend auf die Heraus- 
forderungen der Mixed-Methods-Forschung in der Sozialen Arbeit eingegangen 
werden. Wenngleich in der Ergebnisdarstellung keine Widersprüche während des 
Lesens ersichtlich werden, so muss für die Forschungspraxis eben auch darüber 
nachgedacht werden, vor welchen Herausforderungen die Mixed-Methods-For- 
schung steht, um auf dieser Grundlage kritische Perspektiven zu diskutieren. 


Schluss: Kritische Perspektiven zur Mixed-Methods-Forschung 
in der Sozialen Arbeit 


Soziale Arbeit nutzt Methoden der Sozialforschung, um Erkenntnisse zu gene- 
rieren, die über die Lebenslagen der Nutzer:innen aufklären, gesellschaftliche 
Wandlungsprozesse dokumentieren, die normative Architektur des Wohlfahrts- 
staates rekonstruieren sowie die organisationalen und interaktiven Bedingungen 
professionellen Handelns zum Gegenstand haben. In dieser Hinsicht sind Mixed- 
Methods-Designs eine methodische Möglichkeit des Forschens. Der Vorteil liegt 
sicherlich darin, dass durch die Kombination sowohl qualitativer als auch quan- 
titativer Methoden ein dichtes Netz an Erkenntnissen um die zu untersuchenden 
Gegenstände herum entworfen wird. Jedoch dürfen die damit verbundenen He- 
rausforderungen nicht unterschätzt werden, da die Logiken im Kontext qualita- 
tiven/quantitativen Forschens als different bezeichnet werden können und so 
angeordnet werden müssen, dass sie entlang von Methodologie und Ergebnisdar- 
stellung eine Kohärenz erzeugen. Cloos et al. (2021: 250) argumentieren, und da- 
rin liegt die Herausforderung, dass Mixed-Methods-Designs eine Forschungskultur 
voraussetzen, um als eine Möglichkeit des Forschens anerkannt zu werden. Aller- 
dings sehen sie dieses Kriterium bei weitem noch nicht erfüllt und machen dies 
anhand forschungspraktischer Herausforderungen deutlich. Sie verweisen hierzu 
auf die Forschungsförderung für Mixed-Methods-Designs: Die 
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„aktuelle Forschungsförderung begünstigt u.a. durch strikte Vorgaben 
bei der Förderdauer bestimmte Forschungsformate, insbesondere se- 
quenzielle Designs, da diese besser nachvollziehbar machen, wie der 
Forschungsprozess geplant wird. Auch hier wären nicht nur erweiterte 
zeitliche und monetäre Ressourcen für die Förderung von Mixed Met- 
hods Forschung notwendig, weil diese grundsätzlich kostenintensiver 
ist als rein quantitative oder qualitative Forschung und der Aufwand an 
Koordination und Kommunikation höher ist“ (ebd.). 


Wie die Bedingungen zur Beantragung von Drittmitteln beschaffen sind, entschei- 
det u.a. auch darüber mit, inwiefern sich eine Forschungskultur etablieren kann. 
Aber die Hürden für die Forschungsförderung sind nicht so hoch, dass sie nicht 
überwindbar wären. Die Forschungsaktivitäten von Albus et al. (2010) zur ‚Wir- 
kungsorientierten Jugendhilfe‘ oder aber auch das aktuell geförderte Forschungs- 
projekt von Graßhoff, Idel und Sauerwein im Feld der Ganztagsbildung (siehe 
dazu https://wp.uni-oldenburg.de/forschungsprojekt-laktat/) sind Beispiele da- 
für, dass es Möglichkeiten der Forschungsförderung gibt. Aber dennoch, und dar- 
auf weisen Cloos et al. hin, trifft Mixed-Methods-Forschung in der Praxis nicht auf 
ideale Bedingungen für die Beantragung von Drittmitteln. 

Ebenso aber ist eine forschungspolitische Problematisierung nicht ganz un- 
begründet, die auf der Argumentation basiert, dass Mixed-Methods-Ansätze bis- 
her einen Schwerpunkt auf quantitative Forschungsstrategien hatten. So kritisiert 
Schreier (2017), dass Mixed-Methods-Forschung nicht gleich bedeutet, dass „qua- 
litative und quantitative Methoden gleichberechtigt verwendet werden. Vielmehr 
[dominiere] eine quantitative, im Postpositivismus verankerte Vorgehensweise die 
MM-Forschung“ (ebd.: 14). Dies wirkt erst einmal enttäuschend, da damit das ei- 
gentliche Ziel der Gleichberechtigung verfehlt wird, welches aber als ein zentrales 
Postulat in der Mixed-Methods-Forschung beschrieben wurde (vgl. ebd.). Im Zuge 
dieser Kritik ist eine Dynamik entstanden, die eine Betonung auf im Schwerpunkt 
qualitative Strategien beinhaltete (vgl. ebd.). Und so wird doch auch hier eine 
Ambivalenz deutlich, die an ‚alte Streitigkeiten‘ erinnert, sodass in der Mixed-Met- 
hods-Forschung ein politischer Akzent enthalten ist. 

Für Soziale Arbeit als forschende Disziplin folgt daraus erst einmal, dass Mi- 
xed-Methods-Ansätze eine Chance darstellen, um komplexe Forschungsfragen be- 
arbeiten zu können. In den beiden vorgestellten Studien zur Kooperation zwischen 
Sozialpädagogik sowie Kinder- und Jugendpsychiatrie (Müller-Luzi/Schmid 2017) 
und zu den Entwicklungen der Neuen Rechten in der Sozialen Arbeit (Gille/Ja- 
gusch 2019) werden die Ergebnisdarstellungen in eine Konstellation gebracht, die 
einen mehrdimensionalen Blick auf den untersuchten Gegenstand ermöglichen; 
dadurch wird ein komplementär(er)es Bild skizziert. Während des Lesens dieser 
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Studie ist nicht der Eindruck von Differenz, sondern vielmehr von Komplementa- 
rität entstanden. Um dieses Potenzial sich zunutze machen zu können, setzt dies 
voraus, dass eine kommunikative Infrastruktur innerhalb der Disziplin geschaf- 
fen werden müsste, damit über methodologische Rahmungen und methodische 
Strategien nachgedacht wird. Bei aller Diskussion darüber aber gilt wie bei allen 
forschungsstrategischen Überlegungen: Das Vorgehen bzw. die Verwendung von 
Methoden hat sich am Gegenstand und dem jeweiligen Forschungsinteresse zu 
orientieren — und dies gilt selbstverständlich auch für Mixed-Methods-Designs. 
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3.1 Prozessproduzierte Verwaltungsdaten am 
Beispiel des Forschungsdatenzentrums der 
Rentenversicherung (FDZ-RV) 


Katharina Werhan & Leila Akremi 


1 Was sind prozessproduzierte Daten? 


1.1 Begriffsbestimmungen 


Forscher:innen können zur Beantwortung ihres Erkenntnisinteresses ganz ver- 
schiedene Datensorten heranziehen. Je nach Analyseziel impliziert ein quanti- 
tatives (vgl. Stein 2019), qualitatives (vgl. Przyborski und Wohlrab-Sahr 2019) 
oder Mixed-Methods-Forschungsdesign (vgl. Schoonenboom und Johnson 2017) 
verschiedene Datenerhebungs- und Datenanalyseverfahren. Ziel des Forschungs- 
prozesses ist die Beantwortung der jeweiligen Forschungsfragen, die sich z.B. auf 
Merkmalsverteilungen, Typenbildung, das Entdecken von kausalen Zusammen- 
hängen oder die Untersuchung gesellschaftlichen Wandels in ausgewählten Zeit- 
räumen beziehen können. In der Konzeption der Datenerhebung gilt es zu klären, 
ob es notwendig ist, eigene Forschungsdaten zur generieren, oder ob nicht bereits 
gute Daten vorhanden sind, welche die Forscher:innen nutzen können. Innerhalb 
von Forschungsprojekten erhobene Daten werden als Primärdaten bezeichnet, 
während der Rückgriff auf bereits von anderen Forschenden erzeugte Forschungs- 
daten eine Analyse von Sekundärdaten darstellt. Sekundardaten können z.B. Da- 
tensätze sein, die im Rahmen von standardisierten Befragungen entstanden sind 
(vgl. Mochmann 2019) (vgl. Kap. 3.2), aber auch Transkripte, Audioaufnahmen 
oder Videomaterial aus qualitativen Studien (vgl. Medjedovid 2019). Eine weitere 
wichtige Unterscheidung besteht zwischen Forschungsdaten und prozessproduzier- 
ten Daten. Erstere werden explizit zum Zwecke wissenschaftlicher Studien erho- 
ben, letztere entstehen dagegen in unterschiedlichsten, nicht auf wissenschaftliche 
Verwertung angelegten Kontexten. Prozessproduzierte Daten als administrative 
Daten, Verwaltungsdaten oder soziale Buchführungsdaten dienen in erster Linie 
zur Durchführung von Verwaltungsvorgängen. Es handelt sich um „Daten [...], 
die als Aufzeichnungen öffentlicher und privater Organisationen im Rahmen ihrer 
Tätigkeit und nicht nur zum Zwecke wissenschaftlicher bzw. statistischer Auswer- 
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tung gesammelt werden bzw. wurden“ (Bick und Müller 1984: 123). Im Rahmen 
von Verwaltungshandeln entstehen aber auch Daten, z.B. der Mikrozensus, die 
explizit für statistische Auswertungen erhoben werden (vgl. Hartmann und Len- 
gerer 2019). Begrifflich weiter gefasst, können Forscher:innen jegliche Daten, die 
in gesellschaftlichen Prozessen entstanden sind, als prozessproduzierte Daten für 
wissenschaftliche Studien nutzbar machen, so z.B. spezifische Texte (Romane, Zei- 
tungsartikel, Blogeinträge), Artefakte (Gebäude, Gebrauchsgegenstände), Pläne/ 
Karten oder audiovisuelle Daten (Filme, Schulungsvideos, Uberwachungsvideos). 
Es gibt vielfältige Gründe, warum Forscher:innen auf eine eigene Daten- 
erhebung verzichten und stattdessen bereits vorhandene Datenquellen nutzen. 
Ein wichtiger Faktor bezieht sich auf zeitliche und finanzielle Ressourcen. Eigene 
Datenerhebungen können je nach Umfang sehr teuer und zeitaufwendig sein. Im 
Idealfall gibt es alternativ einen kostengünstigen Zugang zu bereits bestehenden 
Datenquellen, die auch schon für Forschungszwecke aufbereitet sind. Das Gebot der 
Datensparsamkeit (vgl. Kap. 5) empfiehlt außerdem, vor jedem neuen Forschungs- 
anliegen vorab zu prüfen, ob sich die Fragestellung mit bereits vorhandenen Daten 
beantworten lässt. Für manche Erkenntnisinteressen ist es auch schlicht nicht aus- 
reichend oder nicht zielführend eigene Forschungsdaten zu erheben, etwa wenn ge- 
sellschaftliche Prozesse über lange Zeiträume rekonstruiert werden sollen. Sowohl 
forschungsorientierte Sekundärdaten als auch prozessproduzierte Daten können 
dementsprechend eine Alternative zu eigener Datenerhebung sein. 


1.2 Analyse von administrativen Daten am Beispiel der 
Rentenversicherungsdaten 


Prozessproduzierte (administrative) Daten spielen mindestens seit dem 19. Jahr- 
hundert eine wichtige Rolle für die Sozialforschung (zur frühen Verwendung und 
Geschichte von prozessproduzierten Daten siehe z.B. Ziegler 2017: 15-118 oder 
Baur et al. 2020: 213-219). Im 20. Jahrhundert hat sich aber die standardisierte 
Befragung als dominantes Erhebungsinstrument zur Generierung von Forschungs- 
daten entwickelt, einschließlich großen Bemühungen, die Qualität von Surveys zu 
verbessern. Bei Prozessdaten fand solch eine methodologische Reflexion intensiv 
erst ab den 1960er Jahren statt. Grundlegend sind bis heute die Arbeiten von Bick 
und Müller (1977, 1984). 

Am Beispiel der Daten der Deutschen Rentenversicherung lassen sich einige 
Vor-, aber auch Nachteile bzw. Grenzen der Verwendung von administrativen Ver- 
waltungsdaten allgemein und im Gegensatz zu Surveydaten! aufzeigen. Die Deut- 


1 Die Begriffe „Survey“ und „Umfrage“ sowie „Surveydaten“ und „Umfragedaten“ werden in 
diesem Beitrag synonym verwendet. 
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sche Rentenversicherung erfasst für Versicherte alle wichtigen Informationen zum 
Versicherungsverlauf, um darauf aufbauend Renten berechnen und auszahlen zu 
können. Zum Jahresende 2020 waren bei der Deutschen Rentenversicherung ca. 
39 Millionen Personen aktiv versichert (vgl. Deutsche Rentenversicherung 2022) 
und sie leistete Rentenzahlungen an nahezu 26 Millionen Rentner:innen (vgl. 
Deutsche Rentenversicherung 2021). Dadurch ergibt sich eine vielfältige Daten- 
basis, die Forscher:innen für ihre Fragestellungen nutzen können. Ein erster Vor- 
teil dieser Daten besteht demnach in sehr hohen Fallzahlen und Daten über sehr 
lange Zeiträume, die standardisierte Befragungen kaum liefern können. Einerseits 
ermöglicht dies sehr differenzierte Analysen oder die Einbeziehung spezifischer 
Gruppen, die in der Bevölkerung nur geringe Anteile aufweisen. Andererseits sind 
über Zusammenstellungen von Querschnittsdatensätzen Zeitreihen- sowie mit 
Paneldatensätzen auch Längsschnittanalysen möglich. In der Regel liegen alle 
für das Verwaltungshandeln (z.B. Rentenberechnung) notwendigen Informatio- 
nen vor und werden geprüft, weshalb kaum Unsicherheit oder Verzerrung bezüg- 
lich fehlender Werte (Item-Nonresponse) zu erwarten sind. Diese hohe Qualität 
der Daten wird zum einen durch gesetzliche Meldepflichten und zum anderen 
durch spezielle Verfahren wie etwa die Kontenklärung erzielt. Bei letzterer kön- 
nen die Versicherten fehlende Informationen ergänzen. Es ist davon auszugehen, 
dass sie ein eigenes Interesse an vollständigen und richtigen Informationen für die 
späteren Rentenzahlungen besitzen. Im Gegenzug zu Surveys entfallen dadurch 
größtenteils auch typische Fehlerquellen der Befragten wie Auskunftsverweigerung, 
Erinnerungsfehler, selektive Verzerrung aufgrund von sozialer Erwünschtheit oder 
Panelmortalität. Da die einzelnen Sozialversicherungen zu gemeinsam vereinbar- 
ten Statistikmerkmalen Daten liefern, sind die Daten geprüft und verfügen über 
ausführliche Dokumentationen. Ein weiterer Vorteil sind klare Definitionen ver- 
schiedenster sozialer Phänomene, da sich die in den Datensätzen operationalisierten 
Merkmale an der Sozialgesetzgebung orientieren. Seit 2012 besteht unter strengen 
Datenschutzbestimmungen außerdem die Möglichkeit, verschiedene Datensätze 
mittels eingeführter Pseudonyme zu verknüpfen. 

Generelle Nachteile nicht selbst erhobener Daten bestehen in der Datenver- 
fügbarkeit für die jeweiligen Forschungsfragen, im Auffinden geeigneter Daten und 
auch im Datenzugang. Die Daten können außerdem durch den Prozess der Entste- 
hung, durch die Art der Speichermedien und Aufbewahrung verzerrt sein. Insge- 
samt besteht also die Herausforderung darin, dass sich der komplette Prozess der 
Datenentstehung, Aufbereitung und Aufbewahrung den Forscher:innen entzieht. 
Sowohl bei der Sekundäranalyse von Forschungsdaten wie Surveys als auch bei 
prozessproduzierten Daten ist es somit unerlässlich, sich mit den Besonderheiten, 
dem Potenzial, aber auch den Grenzen der Daten genauestens auseinanderzuset- 
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zen. Während Forscher:innen im Rahmen von Surveys für alle Phasen des For- 
schungsprozesses potenzielle Fehlerquellen und deren Auswirkungen prüfen und 
sich dies als „Fehlerkunde“ bezeichnen lässt, schlagen Bick und Müller (1984) für 
die Prüfung von Verwaltungsdaten in Anlehnung an die Arbeit mit historischen 
Quellen eine „Datenkunde“ vor (siehe auch Baur 2009). Mika (2009) hat ausge- 
hend von Bick und Müller ein Prüfschema speziell für die Verwendung von Renten- 
versicherungsdaten entwickelt, welches Forschende zur Beurteilung der Daten für 
das eigene Forschungsvorhaben heranziehen können. 

Im ersten Schritt ist ein Abgleichen von wissenschaftlichen und administrati- 
ven Konzepten unerlässlich. Die rechtlichen Definitionsgrundlagen beziehen sich 
häufig auf spezifische Anwendungskontexte und können (erhebliche) Differenzen 
zu sozialwissenschaftlichen Phänomenen aufweisen. Die gewünschte Zielgruppe 
kann z.B. nur teilweise erfasst werden oder es sind zusätzliche Gruppen einbezo- 
gen (under- und overcoverage). In diesem Zusammenhang weist Mika (2009) auch 
darauf hin, dass speziell im Kontext mit Verwaltungen das unterschiedliche Inan- 
spruchnahmeverhalten dazu führen kann, dass administrative Daten verzerrt sind. 
Im Gegensatz zu bedarfsgeprüften Leistungen wie etwa der Grundsicherung, ist 
dies für die Rentenversicherungsdaten allerdings kaum von Bedeutung. Wesent- 
lich für diesen ersten Prüfschritt ist nach Mika (2009), dass sich Forscher:innen 
Wissen über Vorgaben für Verwaltungshandeln aneignen. 

Im zweiten Schritt sollen Forschende die Genauigkeit der administrativen Da- 
ten prüfen, denn die Produktion von Verwaltungsdaten stellt ein komplexes Zu- 
sammenspiel verschiedener Akteur:innen und administrativer Verfahren dar. So 
können Datenproduzierende innerhalb von Behörden Fehler machen, mehr oder 
weniger große Entscheidungsspielräume besitzen oder aber eigene Interessen 
verfolgen. Es kann auch sein, dass Akten unvollständig sind, dass Probleme in der 
Kommunikation zwischen Sachbearbeitung und Versicherten bestehen oder aber 
dass Fehler in der Übermittlung spezifischer Daten von anderen Stellen an die 
Rentenversicherung entstehen. Auch wenn die Qualität der Rentenversicherungs- 
daten als sehr hoch einzustufen ist, so ist doch — wie bei anderen Daten auch - nicht 
davon auszugehen, dass sie fehlerfrei sind. Des Weiteren regeln rechtliche Rah- 
menbedingungen, welche Daten in welcher Form erfasst und gespeichert werden 
dürfen, was sowohl einen beschränkten als auch komplexen Merkmalskanon bei 
den Rentenversicherungsdaten zur Folge hat. Insofern müssen Forscher:innen vor- 
ab prüfen, ob sich die Forschungsfragen auch mit den vorhandenen Merkmalen 
adäquat beantworten lassen oder ob sie weitere bzw. andere Daten benötigen. 

Bei der Datenverarbeitung und Speicherung können ebenfalls Einschränkun- 
gen entstehen, die Forscher:innen im dritten Schritt beurteilen sollten. Dazu ist 
zunächst anzumerken, dass sich die Datenhaltung, Eingabe der Daten und deren 
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Verarbeitung in erster Linie am Verwaltungshandeln orientieren und es noch im- 
mer nicht selbstverständlich ist, dass alle Daten digital vorliegen. Die Rentenver- 
sicherung hat ihre Verwaltungsverfahren schon sehr lange auf eine automatisierte 
Datenverarbeitung umgestellt, und dadurch, dass die Versichertendaten bis zum 
Rentenfall auch sehr lange Zeiträume umfassen müssen, ist die Gefahr, dass zwi- 
schenzeitlich Daten verloren gehen, geringer als in anderen Kontexten (vgl. Mika 
2009). Nichtsdestotrotz können auch hier z.B. durch unvollständig geklärte Kon- 
ten oder rechtliche Festsetzungen bestimmte Informationen fehlen. 

Die letzten beiden Prüfschritte beziehen sich auf die Qualität prozessproduzierter 
Daten für ein statistisches Berichtswesen und die Generierung von Daten für die Wis- 
senschaft (vgl. Mika 2009). Verwaltungen können Teile ihrer Daten auch für ein sta- 
tistisches Berichtswesen nutzen. In diesen aggregierten Statistiken lässt sich z.B. 
prüfen, welche Variablen in welcher Form verwendet werden und inwiefern dies 
mit den wissenschaftlichen Konzepten korrespondiert. Des Weiteren ist die IT-In- 
frastruktur mit Verwaltungshard- (z.B. Großrechner) und -software (Verwaltungs- 
programme) nicht automatisch so angelegt, dass ein Transfer in wissenschaftliche 
Datensätze einfach vonstattengeht. Hierzu müssen die Datenverantwortlichen 
Konzepte der Datentransformation entwickeln und entscheiden, welche Variablen 
in welcher Form für wissenschaftliche Zwecke zur Verfügung gestellt werden kön- 
nen. Datenschutzbestimmungen können dabei zu Einschränkungen in der Diffe- 
renzierung von Mikrodaten führen. Außerdem ist wichtig, in welchen Formaten 
die Datensätze angelegt und gespeichert werden, damit sie auch über längere Zeit 
verwendbar sind. Des Weiteren benötigen Forscher:innen für die Arbeit mit den 
Daten allgemein verständliche Dokumentationen. 

Sich genauestens mit dem Entstehungszusammenhang von prozessproduzier- 
ten Daten auseinanderzusetzen, ist insbesondere vor dem Hintergrund der wach- 
senden Bedeutung von digitalen Massendaten im Rahmen von Big-Data-Analysen 
(vgl. König et al. 2018; Baur et al. 2020) zwingend erforderlich, um nicht falsche 
Erwartungen an das Material zu stellen oder unzulässige Schlussfolgerungen auf- 
grund verzerrter Daten zu ziehen. In Bezug auf administrative Daten lässt sich aber 
festhalten, dass sich die Bedingungen für die wissenschaftliche Forschung in den 
letzten zwei Jahrzehnten deutlich verbessert haben. So waren bei der Rentenversi- 
cherung lange Zeit nur Aggregatdaten in Form von Tabellenbänden verfügbar. Mit 
der Entstehung verschiedener Forschungsdatenzentren für amtliche Daten fand 
eine Institutionalisierung und Professionalisierung statt (vgl. Thiede/Mika 2018), 
die eine bessere Datenzugänglichkeit sowie eine kontinuierliche Erweiterung des 
Datenangebots beförderte. Im Rahmen der Nationalen Forschungsdateninfrastruk- 
turstrategie (NFDI) haben sich mittlerweile ca. 40 vom Rat für Sozial- und Wirt- 
schaftsDaten (RatSWD) akkreditierte Forschungdatenzentren im Konsortium für 


68 


Katharina Werhan & Leila Akremi 


die Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften (KonsortSWD) 
zusammengeschlossen. Vertreter:innen der Forschungsdatenzentren (Datenhal- 
ter) und der Wissenschaft arbeiten dort gemeinsam an der Verbesserung und Wei- 
terentwicklung der Forschungsdateninfrastruktur (siehe www.konsortswd.de). 

Im Folgenden gehen wir genauer auf das Datenangebot der Deutschen Renten- 
versicherung ein und zeigen anschließend anhand konkreter Forschungsbeispiele 
Analysepotenziale, Lösungen hinsichtlich Herausforderungen bei der Arbeit mit 
den Daten sowie Grenzen auf. 


2 _Forschungsdatenangebot der Deutschen 
Rentenversicherung 


2.1 Woher kommen die Daten? 


Das Zahlen von Beiträgen zur gesetzlichen Rentenversicherung ist für die meisten 
Angestellten in Deutschland Pflicht, und auch in anderen sozialen Erwerbssitua- 
tionen werden Beiträge zur gesetzlichen Rentenversicherung entrichtet. Dies sind 
z.B. Ausbildungszeiten, Zeiten der Kindererziehung, der Pflege Angehöriger sowie 
des Bezugs von Arbeitslosen- oder Krankengeld. Somit hat die Mehrheit der deut- 
schen Bevölkerung im Verlauf ihres Lebens mindestens einmal Kontakt zur Deut- 
schen Rentenversicherung und diese besitzt Daten über ca. 90 % der Bevölkerung. 
Jede:r bei der gesetzlichen Rentenversicherung Versicherte hat ein individuelles, 
administratives Konto mit Sozialversicherungsnummer, in dem seit der Gründung 
der Rentenversicherung versicherungsrelevante Daten gesammelt werden (vgl. 
Mika 2009). 

Die Daten werden mittels des 1973 eingeführten, integrierten Meldeverfahrens 
zur Kranken-, Renten- und Arbeitslosenversicherung (DEÜV) von Arbeitgeber:in- 
nen über die Krankenkassen an die 16 Träger der gesetzlichen Rentenversicherung 
übertragen. Die von den Arbeitgeber:innen gemeldeten Angaben unterscheiden 
sich in rechtlich durchsetzbare Pflichtangaben (im Falle der Rentenversicherung 
das Einkommen aus sozialversicherungspflichtiger Beschäftigung) und Angaben, 
die lediglich zu statistischen Zwecken gemeldet werden (z.B. Beruf und höchster 
Bildungsabschluss) (vgl. Mika 2009). 

Um die Richtigkeit und Vollständigkeit der Daten zu gewähren, findet auf An- 
trag des oder der Versicherten eine „Kontenklärung“ statt oder sie wird durch den 
Rentenversicherungsträger eingeleitet. In diesem Verfahren werden z.B. Zeiten 
der schulischen Ausbildung oder des Studiums erfasst, die nicht Teil des automa- 
tischen Meldeverfahrens sind. Des Weiteren sind Angaben über Geburten von Kin- 
dern oder Erziehungszeiten vor der Kontenklärung nicht zuverlässig erfasst, da es 
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hier wie bei den Ausbildungs- und Studienzeiten kein geordnetes Meldeverfahren 
gibt. 

Die einzelnen Rentenversicherungsträger melden zentrale Informationen in 
pseudonymisierter Form an das Datenzentrum der DRV Bund, wo diese auf Voll- 
ständigkeit und Korrektheit geprüft, bereinigt und dann in anonymisierter Form 
für das statistische Berichtswesen und die wissenschaftliche Forschung bereitge- 
stellt werden. Die Ergebnisse des statistischen Berichtswesens sind im Statistikpor- 
tal (www.statistik-rente.de) der DRV-Bund in aggregierter Tabellenform öffentlich 
zugänglich. Das Forschungsdatenzentrum der Rentenversicherung (FDZ-RV) be- 
reitet die vom Datenzentrum der DRV Bund bereitgestellten Statistikdaten aus den 
Versichertenkonten sowie Informationen aus Renten- und Rehabilitationsanträgen 
auf, dokumentiert sie und stellt sie dann der wissenschaftlichen Forschung in Form 
von Mikrodaten, d.h. Daten auf Personenebene, in verschiedenen Anonymisie- 
rungsgraden zur Verfügung. 


2.2 Datenangebot allgemein 


Welche Daten aus dem DEÜV-Verfahren und den Verwaltungsverfahren der Ren- 
tenversicherung für das statistische Berichtswesen und die Forschung bereitge- 
stellt werden, ist in der allgemeinen Verwaltungsvorschrift über die Statistik in der 
Rentenversicherung (RSVwV) nach 8 79 Abs. 2 SGB IV festgelegt. 

Die vom FDZ-RV bereitgestellten Daten gliedern sich in drei Statistikbereiche: 
Rentenstatistik, Versichertenstatistik und Reha-Statistik (Abbildung 1). Alle Da- 
tensätze enthalten soziodemografische Merkmale wie Geburtsdatum, Geschlecht, 
Wohnort, Bildung, Tätigkeit, Staatsangehörigkeit, Geburtsland, Familienstand und 
die Geburtsdaten der Kinder. In den Datensätzen der Rentenstatistik gibt es zusätz- 
lich Informationen zu Art und Höhe der bezogenen Rentenleistungen, zur Zusam- 
mensetzung der Anwartschaften, zu rentenrechtlichen Zeiten sowie zu Lohn und 
Status vor der Rente. Die Daten der Reha-Statistik weisen neben den soziodemo- 
grafischen Merkmalen u. a. Informationen zu Diagnosen, Dauer der Reha-Maßnah- 
men, Übergangsgeld und Zuzahlungen auf. Merkmale aus der Rentenberechnung, 
Informationen zur sozialen Erwerbssituation und zu Einkommen/Entgeltpunkten 
finden sich in den Datensätzen aus der Versichertenstatistik (Tabelle 1). 
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Abbildung 1: Strukturierte Überblick über das Datenangebot des FDZ-RV 


Rentenstatistik | Versichertenstatistik Reha-Statistik 
I =t] en l 
Scientific Use Files Public Use Files Scientific Use Files Public Use Files Scientific Use Files Public Use Files 


Querschnittdaten Querschnittdaten Querschnittdaten Längsschnittdaten Querschnittdaten re 


Langsschnittdaten Langsschnittdaten 


Quelle: eigene Darstellung 


Die Datensätze des FDZ-RV unterscheiden sich grundsätzlich im Differenzierungs- 
und Anonymisierungsgrad der Daten. Scientific Use Files sind anonymisierte Sta- 
tistikdaten, die ausschließlich für Forschung in unabhängigen, wissenschaftlichen 
Einrichtungen (auch Ressortforschungseinrichtungen) zugänglich sind. Forschen- 
de dürfen diese Datensätze nach Abschluss eines Nutzungsvertrages in den eigenen 
Räumen der wissenschaftlichen Institutionen auswerten. Public Use Files hingegen 
bieten der interessierten Fachöffentlichkeit und der Lehre an Universitäten/Hoch- 
schulen einen barrierearmen Zugang zu den Daten der Rentenversicherung. Sie 
beinhalten eine kleinere Stichprobe als die Scientific Use Files, und die Merkmale 
sind restriktiveren Kriterien unterworfen. 

Neben der Nutzung von Datensätzen auf dem eigenen Computer der Forschen- 
den gibt es die Möglichkeit, eine On-Site-Version der Statistikdaten im kontrollier- 
ten Fernrechnen oder an einem der Arbeitsplätze für Gastwissenschaftler:innen bei 
der Rentenversicherung zu nutzen. Diese Datensätze sind in geringerem Maße 
anonymisiert und enthalten einen größeren Stichprobenumfang als die Scienti- 
fic Use Files bis hin zur Vollerhebung der Zielpopulation. Die Zugangswege, die 
Forschende wählen, hängen von ihren Fragestellungen ab; dabei kann sich auch 
ein mehrstufiges Verfahren herausbilden. Idealerweise erfolgt der Zugang zu den 
Daten über die Arbeit mit thematisch adäquaten Public oder Scientific Use Files, 
die sich dann durch die Arbeit mit einer On-Site-Version ergänzen lassen. 

Neben der Differenzierung nach Anonymisierungs- und Detailgrad unterschei- 
den sich die Daten des FDZ-RV auch in Längs- und Querschnittsdaten. Die Längs- 
schnittdaten enthalten monatsgenaue Informationen aus den Versichertenkonten 
wie Einkommen und Entgeltpunkte. Die Querschnittsdatensätze bieten Informatio- 
nen aus dem Versichertenkonto oder zu Rentenzahlungen zu einem bestimmten 
Stichtag im jeweiligen Berichtsjahr. 
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Um einen ersten Eindruck in die Daten des FDZ-RV zu gewähren, gehen wir an 
dieser Stelle kurz auf die Struktur des Datensatzes „Vollendete Versichertenleben“ 
(VVL) ein. Abbildung 2 zeigt eine schematische Versichertenbiografie. Diese ent- 
hält den Zustand einer versicherten Person für jeden Monat des relevanten Zeit- 
raums. 


Abbildung 2: Schematische Versichertenbiografie 


Schulische Ausbildung 

Berufliche Ausbildung | 

Wehr- und Zivildienst i 

Sozialversicherungspflichtig erwerbstätig le 

Geringfügig beschäftigt 

Selbstständig 

Arbeitsunfahigkeit/ Krankheit | e 
Arbeitslos Hi 

Kindererziehung und Haushalt 

Nichterwerbsmäßige Pflege | 

Bezug Erwerbsminderungsrente ey 
Bezug Altersrente | | 
Sonstiges 


Jan. Dez. 
14 Jahre Zeit (t) 65 Jahre 


Quelle: eigene Darstellung angelehnt an Stegmann 2007 


In den ersten Jahren befand sich die Beispielperson in schulischer, anschließend in 
beruflicher Ausbildung. Auf den Zivildienst folgt eine mehrjährige Periode sozial- 
versicherungspflichtiger Erwerbstätigkeit, unterbrochen durch zwei Jahre Arbeits- 
losigkeit. Im letzten Drittel der Biografie pflegt die Person eine Angehörige und 
bezieht nach längerer Krankheit zunächst eine Erwerbsminderungsrente, dann 
eine Altersrente. Die Daten der VVL enthalten solche Versichertenbiografien für 
jede Person im Datensatz. 


3 Forschung mit FDZ-RV-Daten 


Im Allgemeinen eignen sich die Daten des FDZ-RV aufgrund des langen Zeithori- 
zonts und der jährlichen Veröffentlichung neuer Daten sehr gut für Trendanalysen 
oder zur Beobachtung der Interaktion von sozialem Wandel und dem Wandel sozi- 
aler Institutionen. Dass Teile der Daten gleichzeitig monatsgenaue Beobachtungen 
zulassen, eröffnet außergewöhnliche Möglichkeiten für Lebensverlaufsanalysen 
und für die Analyse von Reformeffekten. Die beinahe Vollerhebung der bundes- 
deutschen Erwerbsbevölkerung bzw. Rentner:innen erlaubt zudem die Analyse 
spezieller, in anderen Daten unterrepräsentierter Gruppen sowie regional diffe- 
renzierte Analysen mit ausreichend großen Fallzahlen (vgl. hierzu z.B. Himmel- 
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reicher 2005; Stegmann et al. 2005; Fachinger/Himmelreicher 2006; Stegmann 
2007; Stegmann/Himmelreicher 2007; Himmelreicher/Stegmann 2008). 

Auch wenn es weniger offensichtlich ist, eignen sich die Daten der Rentenver- 
sicherung auch, um bildungswissenschaftlichen Fragestellungen nachzugehen. Sie 
bilden Erwerbsverläufe ab dem Ende der Schulzeit bzw. dem Beginn der Berufsaus- 
bildung ab. Daher kann mit diesen Daten gut analysiert werden, wie schnell und 
mit welchem Gehalt nach der Ausbildung die Erwerbstätigkeit gestartet werden 
konnte. Auch die Fortsetzung und die Anzahl der Unterbrechungen in der Erwerbs- 
tätigkeit im Lebenslauf können betrachtet werden, teilweise unter Berücksichti- 
gung der Gründe für die Lücken und Abbrüche wie Krankheit, Arbeitslosigkeit oder 
Zeiten der Kindererziehung und Pflege. 

Ein gutes Beispiel für die vielseitigen Forschungsmöglichkeiten und auch 
explorativen Zugänge, die die administrativen Daten des FDZ-RV bieten, ist das 
Projekt von Söhn (2018) „Migration: Erwerbsverläufe und Rentenansprüche 
von Migrant:innen bei der gesetzlichen Rentenversicherung Deutschlands“. Ziel 
des Projekts war es „vor dem Hintergrund der demographischen Alterung sowie 
der bisherigen und zukünftigen Migration nach Deutschland [...] die Rentenan- 
sprüche von Zugewanderten und deren vorangegangene Erwerbsbiografien [zu 
untersuchen]. Analysiert werden [...] der Zugang von Migrant:innen zu eigenen 
gesetzlichen Altersrenten, die hiermit einhergehende soziale Selektivität sowie 
die Einkommenssituation in den Haushalten der Bezieher:innen und Nicht-Be- 
zieher:innen solcher Renten“ (Söhn 2018). Zudem nahm Söhn eine differenzierte 
Untersuchung der Unterschiede innerhalb der Migrant:innenpopulation vor. 

Ein Beispiel für die Analyse von Reformeffekten ist die Arbeit von Geyer et al. 
(2017, 2019). Die Studie untersucht die Arbeitsmarkteffekte der Abschaffung der 
„Altersrente für Frauen“. Diese Reform aus dem Jahr 1999 führte dazu, dass das 
frühestmögliche Renteneintrittsalter für viele Frauen ab der Geburtskohorte 1952 
schlagartig von 60 auf 63 Jahre anstieg (vgl. Geyer et al. 2019: 240). Die Reform 
war Teil mehrerer Bemühungen, das Renteneintrittsalter angesichts der steigen- 
den Belastung der öffentlichen Finanzen durch den demografischen Wandel an- 
zuheben. Die Studie von Geyer et al. untersucht, ob betroffene Frauen infolge der 
Reform wie angestrebt ihre Erwerbstätigkeit verlängern oder verstärkt in Arbeits- 
losigkeit, Nichterwerbstätigkeit oder Erwerbsminderung wechseln. Dadurch dass 
die Reform nicht schrittweise, sondern abrupt zu einem Stichtag in Kraft trat, lässt 
sie sich als quasi-natürliches Experiment interpretieren und eignet sich daher be- 
sonders gut zur Beobachtung von kausalen Effekten (vgl. Geyer et al. 2019). 

Im Folgenden veranschaulichen wir anhand dieser beiden Beispiele das Ana- 
lysepotenzial der Daten, gehen gleichzeitig jedoch auch auf die Besonderheiten 
und Herausforderungen ein. Wir orientieren uns zunächst an den in Abschnitt 1 
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beschriebenen Prüfschritten, die es bei der Arbeit mit administrativen Daten zu 
beachten gilt. Im Anschluss stellen wir kurz die verwendeten Methoden und For- 
schungsergebnisse dar. 


3.1 Datenprüfung und Best-Practice-Beispiele für den Umgang mit 
prozessproduzierten Daten 


3.1.1 Abgleichen von wissenschaftlichen und administrativen Konzepten 


Die beiden Beispielstudien wählen unterschiedliche Zielpopulationen. Zum einen 
sind dies Migrant:innen mit einer deutschen Altersrente bei Söhn (2018, 2020), 
zum anderen Frauen, die von der Abschaffung der Altersrente für Frauen betroffen 
waren, bei Geyer et al. (2019, 2017). 

Für Geyer et al. gestaltete sich das Abgleichen von wissenschaftlichen und ad- 
ministrativen Konzepten einfach, da sich die wissenschaftlichen Konzepte bereits 
streng am Rentenrecht orientierten. Sie beschränkten die Stichprobe auf Frauen 
der Jahrgänge 1951 und 1952, da diese genau 12 Monate vor oder nach dem Stich- 
tag der Abschaffung geboren wurden. So wollten sie verhindern, dass aufgrund 
einer größeren zeitlichen Distanz zur Reform weitere Faktoren die Rahmenbedin- 
gungen so beeinflussen, dass Reformeffekte nicht mehr eindeutig zu identifizieren 
sind. Um das Verhalten der beiden Gruppen (Frauen, die vor bzw. nach dem Stich- 
tag geboren sind) unverfälscht vergleichen zu können, betrachteten sie außerdem 
nur Frauen, die die Anspruchsvoraussetzungen für die Altersrente für Frauen er- 
füllten. Da die Anspruchsvoraussetzung auf Grundlage der gesammelten Beiträge 
zur gesetzlichen Rentenversicherung basieren (15 Beitragsjahre, mindestens zehn 
davon nach dem 40. Geburtstag), konnten sie von einer hohen Validität der Daten 
ausgehen. Die verwendeten Daten der Versicherungskontenstichprobe sind reprä- 
sentativ für die deutsche Bevölkerung mit einem Konto bei der gesetzlichen Ren- 
tenversicherung und somit auch für die Zielpopulation (vgl. Geyer/Welteke 2017). 

Für Söhn (2018, 2020) gestaltete sich der Abgleich wissenschaftlicher und ad- 
ministrativer Konzepte etwas schwieriger. Um den Zugang von Migrant:innen zu 
eigenen gesetzlichen Altersrenten zu analysieren, muss zunächst definiert werden, 
wer zur Gruppe der „Migrant:innen“ gehört. Dabei gilt es zum einen zu beachten, 
welche Gruppen rentenrechtlich interessant sind, zum anderen müssen diese aber 
auch in den Daten unterscheidbar sein. Im theoretischen Teil der Arbeit identifiziert 
Söhn drei Gruppen von Migrant:innen, die sie vergleichend analysieren möchte: 
(a) Zugewanderte ohne deutsche Staatsangehörigkeit, (b) (Spät-)Aussiedler:innen 

sowie (c) Zugewanderte mit deutscher Staatsangehörigkeit durch Einbürgerung. 
Die beobachtete Population beschränkt sie zusätzlich auf ältere Zugewanderte 
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(Geburtsjahrgang 1946 und älter/erstmaliger Renteneintritt 2014), die nach 1949 
als Erwachsene zugewandert sind. Beim Abgleichen der wissenschaftlich definier- 
ten Zielpopulation mit den administrativen Daten mussten aufgrund fehlender In- 
formationen einige Annahmen und Einschränkungen gemacht werden. 

Zwar enthält der von Söhn verwendete Datensatz „Vollendete Versicherten- 
leben“ das Merkmal „Staatsagehörigkeit des Versicherten“, welches sich auf den 
ersten Blick ideal eignen müsste, um Zugewanderte ohne deutsche Staatsangehö- 
rigkeit (a) zu identifizieren. Diese Angabe melden Arbeitgeber:innen an die Ren- 
tenversicherung zusammen mit den Tätigkeitszeiten und -entgelten aber lediglich 
aus statistischen Gründen. Es handelt sich nicht um eine Pflichtangabe, deren 
Falschmeldung rechtliche Konse- 
quenzen hätte (vgl. Mika 2006). Dies 


Strategien zur Abbildung der wissen- 
schaftlichen Zielpopulation in prozess- 
produzierten Daten 


führt dazu, dass die Angaben häufig 
mit geringerer Sorgfalt gemacht 
werden. Des Weiteren hat eine Ver- 


- Qualität eines Merkmals einschätzen: 
Pflichtmeldung? Information relevant für 
Rentenberechnung? Konto bereits geklärt? 

- Durch logische Annahmen Gesamtpopula- 
tion einschränken 

- Abgleich mit repräsentativen Daten (z. B. 
DESTATIS, Mikrozensus, Vollerhebung der 
Daten der Rentenversicherung) 

- Kombination mit Surveydaten, um z. B. den 
Haushaltskontext zu untersuchen 


änderung der Staatsangehörigkeit 
keine unmittelbare Auswirkung auf 
sozialstaatliche Leistungen (wie 
etwa eine Heirat, die den Wechsel 
der Steuerklasse nach sich zieht) 
und wird den Arbeitgeber:innen 
daher seltener mitgeteilt. Insofern 
könnte es bei diesem Merkmal Vali- 
ditätseinschränkungen geben (vgl. 
Mika 2006: 58). 


(Spät-)Aussiedler:innen (b) sind hingegen über Beitragszeiten gemäß dem Fremd- 
rentengesetz (FRG) sehr valide identifizierbar. Das eigene finanzielle Interesse der 
Versicherten lässt eine vollständige und qualitativ hochwertige Erfassung dieser 
Zeiten erwarten. 

Sonstige Zugewanderte mit deutscher Staatsangehörigkeit durch Einbürge- 
rung (c) werden über fehlende Dateneinträge in jungen Lebensjahren unter der 
Annahme identifiziert, dass sie sich im Ausland aufhielten, später eingewandert 
sind und eingebürgert wurden (vgl. Söhn 2018: 22). 

Ein weiteres Ziel der Analysen sollte sein, die Einkommenssituation in den 
Haushalten der Bezieher:innen und Nicht-Bezieher:innen eigener gesetzlicher 
Altersrenten zu vergleichen. Dieser Aspekt ist mit den administrativen Daten der 
Deutschen Rentenversicherung allerdings nicht untersuchbar, da es keine Möglich- 
keit gibt, Versichertenkonten auf Haushaltsebene miteinander zu verknüpfen. Um 
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diesen Aspekt der Fragestellung dennoch beantworten zu können, kombinierte 
Söhn die Analyse administrativer Daten mit der Analyse von Befragungsdaten aus 
dem Mikrozensus. 

Dieses Beispiel macht deutlich, dass bei der Arbeit mit administrativen Daten 
die untersuchbare Zielpopulation von der wissenschaftlich interessanten Zielpo- 
pulation abweichen kann oder nur unter Annahmen untersuchbar ist. Forschende 
müssen also sorgfältig prüfen, ob wissenschaftliche Definitionen in den Daten ab- 
bildbar sind und ob die Abdeckung der wissenschaftlich definierten Grundgesamt- 
heit möglich ist. 


3.1.2 Genauigkeit der prozessproduzierten Daten prüfen 


Wie erläutert, hängt die Qualität administrativer Daten stark von den administrati- 
ven Verfahren ab, deren Produkt sie sind. Anhand der Daten des FDZ-RV lässt sich 
festhalten, dass durch die Zusammenarbeit mit den Arbeitgeber:innen, die für die 
monatlichen DEUV-Meldungen an die Sozialversicherungsträger verantwortlich 
sind, die Qualität der gemeldeten Daten erwartungsgemäß besser ist, als wenn die 
Versicherten die Meldung selbst vornehmen müssten. Jedoch liefern sie neben den 
Pflichtangaben eben auch statistische Informationen wie die Staatsangehörigkeit, 
den letzten Bildungsabschluss oder die berufliche Tätigkeit, deren Falschmeldung 
keine rechtlichen Konsequenzen hat. Der Anteil fehlender Werte bei solchen Merk- 
malen ist dadurch erheblich höher und die Validität zweifelhafter (vgl. Mika 2009: 
121). 

Geyer et al. verwendeten vor allem Merkmale, die Auswirkungen auf sozial- 
staatliche Leistungen haben und die somit sehr valide sind. Da die beobachtete 
Population der Frauen der Geburtskohorten 1951 und 1952 zum Zeitpunkt der 
Datenerfassung (2014) bereits 62 bzw. 63 Jahre alt waren, ist für die meisten an- 
lässlich der Rentenberechnung ihr Konto geklärt worden, sodass die Informationen 
vollständig und zuverlässig sind. Darüber hinaus war für die Altersrente für Frauen 
hauptsächlich die Zeit ab dem 40. Lebensjahr bedeutsam, weshalb die häufigsten 
Fehlerquellen im Konto (Zeiten der schulischen und beruflichen Ausbildung, Ge- 
burten von Kindern) vermutlich für die Analyse kaum ins Gewicht fielen. 

Da die Angabe zur Staatsangehörigkeit nicht meldepflichtig ist, musste hin- 
gegen Söhn prüfen, ob die unter Annahmen und Einschränkungen der Datenvalidi- 
tät getroffene Auswahl der Gesamtpopulation der zuvor definierten Zielpopulation 
entspricht, d.h., ob die Anteile der Zielpopulation an der Gesamtpopulation den 
Anteilen in repräsentativen Daten, z.B. des statistischen Bundesamtes, entspre- 
chen. Hierzu nutzte Söhn die bereits erwähnten Daten des Mikrozensus. Diese 
Daten bieten den Vorteil, dass sich die Zielpopulation über Einreisejahr und -alter 
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direkt erfassen lässt, was aber noch nicht Vergleichbarkeit impliziert (z.B. Fehler 
bei Angaben durch Befragte; Altersrente nicht eindeutig von anderen Rentenarten 
unterscheidbar; Daten der DRV enthalten keine Beamt:innen, Hausfrauen/-män- 
ner und nur sehr wenige Selbstständige). Nachdem der Anteil der Zielpopulation 
an der Gesamtpopulation — unter allen gemachten Annahmen und Einschränkun- 
gen — in beiden Datensätzen sehr ähnlich war, konnte Söhn von einer guten Identi- 
fizierung der Zielpopulation ausgehen. 


3.1.3 Datenverarbeitung und Speicherung 


Die Forschungsfrage des Projekts von Söhn zielt darauf ab, Lebensverläufe von Per- 
sonen zu analysieren, für die die Rentenversicherung erstmalig um 1960 Einträge 
im Rentenversicherungskonto verzeichnete. Geyer et al. untersuchen Frauen der 
Geburtskohorten 1951 und 1952. Auch diese haben erstmals in den 1960er-Jah- 
ren Beitragszeiten gesammelt. Seit dieser Zeit haben sich die Erfassungs- und Spei- 
cherbedingungen mehrfach geändert, sodass Verluste oder Fehler in den Daten 
nicht unwahrscheinlich wären. Da die Rentenberechnung in Deutschland jedoch 
den gesamten Lebensverlauf einschließt und nicht nur die letzten Jahre vor der 
Verrentung wie in anderen Ländern, ist das langfristige Speichern korrekter Daten 
eine Hauptaufgabe der Deutschen Rentenversicherung. Es kann also angenom- 
men werden, dass für die in den beiden Projekten untersuchten Populationen mo- 
natsgenaue Daten für den gesamten Verlauf des Erwerbslebens vorliegen. Hinzu 
kommt, dass Söhn mit Daten von Personen arbeitete, die bereits eine Altersrente 
beziehen. Diese Daten wurden zwangsläufig durch ein Kontenklärungsverfahren 
validiert und vervollständigt. 


3.2 Methodische Möglichkeiten und Forschungsergebnisse 


3.2.1 Lebensverlaufsanalysen für spezielle Gruppen: Söhn (2018, 2020) über 
Erwerbsverläufe von Migrant:innen 


Söhn nutzte die Daten des Mikrozensus für bivariate Statistiken und eine multivari- 
ate logistische Regression auf Haushaltsebene, um Einflussfaktoren für den Bezug 
einer gesetzlichen Altersrente bei Migration zu identifizieren. Mit den monatsge- 
nauen Daten des FDZ-RV führte sie eine Kombination von Sequenzmuster- und 
Clusteranalyse durch, um die Erwerbsverläufe bei Zugewanderten mit gesetzlicher 
Altersrente zu typisieren. 

Die Analyse der Daten des Mikrozensus zeigt, dass unter den annähernd 6.700 
Zugewanderten im Datensatz knapp 84% über eine eigene Altersrente verfügen 
(91% bei der autochthonen Bevölkerung). Fast 16% der Migrant:innen gaben 
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an, weder eine Altersrente noch eine Beamtenpension zu beziehen. Ihr Altersein- 
kommen bestritten rund 35% aus Sozialleistungen (z.B. Grundsicherung), 23% 
der befragten Zugewanderten erhielten finanzielle Unterstützung von Familienan- 
gehörigen. Ein Drittel der Haushalte von Zugewanderten mit eigener Altersrente 
hatte ein Haushaltseinkommen unterhalb der Armutsgefährdungsgrenze, bei den 
Haushalten ohne eigene Altersrente war es sogar mehr als die Hälfte. Aus den Re- 
gressionsanalysen ergibt sich, dass Personen mit höherem Einreisealter, weibliche 
Migrantinnen und als Flüchtlinge nach Deutschland gekommene Personen gerin- 
gere Chancen auf eine deutsche Altersrente besitzen, während der (Spät-)Aussied- 
lerstatus die Wahrscheinlichkeit deutlich erhöht. 

Durch Sequenzmusteranalysen der VVL identifiziert Söhn ähnliche Erwerbs- 
verläufe. Diese werden dann mittels Clusteranalysen gruppiert. Das Ergebnis zeigt 
Abbildung 3 am Beispiel des Erwerbsverlaufs von Deutschen ohne Migrationser- 
fahrung (oben) und von Zugewanderten (unten). Auf der horizontalen X-Achse 
sind die Monate der Lebensjahre 19 bis 65 dargestellt, auf der vertikalen Y-Achse 
die Anteile der Personen, die sich im jeweiligen Monat in verschiedenen Zuständen 
befanden. 

So waren ca. zwei Drittel der Deutschen ohne Migrationshintergrund im Alter 
von 19 Jahren bereits erwerbstätig. Im Alter von 65 Jahren befand sich mehr als 
die Hälfte der beobachteten Gruppe in Rente. Bei den Zugewanderten zeigt sich, 
dass rund die Hälfte der Versicherten erst mit Ende 20 nach Deutschland migrierte. 
Im Alter von 50 Jahren ist ca. die Hälfte der Zugewanderten erwerbstätig. „Insge- 
samt bringen es die Zugewanderten nur auf 18 Jahre sozialversicherungspflichtige 
Beschäftigung im Gegensatz zu 31 Jahren bei Einheimischen. Zudem verbringen 
Erstere auch noch einen höheren Anteil der Beschäftigungszeit — 33,3 Prozent ver- 
sus 21,3 Prozent - in Jobs mit unterdurchschnittlichem Jahresgehalt“ (Söhn 2020: 
414). 
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Abbildung 3: Erwerbsverlauf von Deutschen ohne Migrationserfahrung (oben) und von Zuge- 
wanderten (unten) vom Alter 19 bis 65, Renteneintrittskohorte 2014 mit erstmaligem Bezug einer 
gesetzlichen Altersrente 
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Quelle: Söhn (2018: 46, 48) 
Daten: FDZ-RV VVL und Rentenzugang 2014; Zufallsstichprobe n = 12.000 
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Für die Zielpopulation der Migrant:innen identifiziert Söhn sieben Erwerbsver- 
laufstypen, die sich z.B. hinsichtlich des Einreisealters, der Jahre in Erwerbsarbeit/ 
Arbeitslosigkeit/Reproduktionsarbeit und in der Höhe der Altersrente unterschei- 
den. Dabei wird deutlich, dass die oftmals als Einheit betrachtete Gruppe der Mig- 
rant:innen sehr heterogen ist. Nur die Hälfte aller Zugewanderten weist Verläufe 
mit kontinuierlicher Erwerbstätigkeit in abhängiger Beschäftigung nach ihrer Zu- 
wanderung auf. Da keine Informationen zu Zeiten ohne Beiträge (z.B. Hausfrau/ 
-mann, Selbstständigkeit) enthalten sind, lässt sich nicht endgültig klären, ob ei- 
nige in diesen beitragsfreien Zeiten nicht anderweitig für das Alter vorsorgten. Die 
hohen Armutsraten, die sich in der Analyse der Befragungsdaten des Mikrozensus 
zeigten, sprechen jedoch dagegen. 


3.2.2 Effekte politischer Reformen: Geyer und Welteke (2017), Geyer et al. (2018), 
Geyer et al. (2019), Geyer und Welteke (2021) über die Abschaffung der 
„Altersrente für Frauen“ 


Geyer und Welteke (2017, 2021) untersuchten mit Daten der Versicherungskon- 
tenstichprobe, welcher Aktivität Frauen der Zielpopulation im Alter zwischen 58 
und 61 Jahren nachgehen.? Hierzu gruppierten sie alle möglichen Zustände bzw. 
sozialen Erwerbssituationen zu fünf Kategorien: erwerbstätig, arbeitslos, Bezug 
einer Erwerbsminderungsrente, Bezug einer Altersrente, Inaktivität (alle weiteren 
Zustände). 


2 Die Versicherungskontenstichprobe (VSKT) hat die gleiche Struktur wie die VVL, unter- 
scheidet sich jedoch hinsichtlich der Stichprobe. Während die VVL ausschließlich Perso- 
nen enthält, die bereits eine Rente beziehen, ist die VSKT eine repräsentative Stichprobe 
aller Versicherten im Alter zwischen 30-67 Jahren. 


81 


3.1 Prozessproduzierte Verwaltungsdatensicherung 


Abbildung 4: Status leistungsberechtigter Frauen nach Altersgruppe und Geburtskohorte 
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Quelle: Geyer/Welteke (2017: 9) 
Daten: FDZ-RV VSKT 2014 n=3.771 


Abbildung 4 zeigt den Status der Frauen der Geburtskohorten 1951 und 1952, die 
aufgrund der gesammelten Beitragszeiten zum Bezug der Altersrente fiir Frauen 
berechtigt waren. Mehr als ein Viertel der Frauen der Geburtskohorte 1951 be- 
zieht ab dem 60. Lebensjahr eine Altersrente, bei Frauen der Geburtskohorte 1952, 
für die das frühestmögliche Renteneintrittsalter durch die untersuchte Reform auf 
63 Jahre angehoben wurde, ist der Anteil verschwindend gering. Des Weiteren 
zeigt sich, dass Frauen der späteren Geburtskohorte insgesamt häufiger erwerbs- 
tätig sind. Dieser Unterschied ist insbesondere im Alter von 60-61 Jahren deut- 
lich (54% der 1951 geborenen Frauen im Vergleich zu 70% der 1952 geborenen 
Frauen). Neuere Daten aus 2016 bestätigen diese Beobachtung und zeigen, dass 
die Reform auch im Alter von 62-63 Jahren noch Auswirkungen auf das Renten- 
eintrittsverhalten der betroffenen Frauen hat: 46% der 1951 geborenen Frauen 
bezogen in diesem Alter eine Altersrente im Vergleich zu nur 25 % der Frauen, die 
ein Jahr später geboren wurden (vgl. Geyer und Welteke 2021). 
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Abbildung 5: Beschäftigungs- und Rentenbezugsraten nach Alter und Geburtskohorte 
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Quelle: Geyer/Welteke (2017: 9) 
Daten: FDZ-RV VSKT 2014 n=3.771 


Im nächsten Schritt verglichen Geyer et al. den Verlauf der Beschäftigungs- und 
Rentenbezugsraten nach Alter und Geburtskohorte (Abbildung 5). Sie beobach- 
teten einen deutlichen Anstieg der Rentenbeziehenden ab dem Alter 60 in der 
Alterskohorte 1951, der in der Vergleichskohorte nicht zu sehen ist. Auch diese 
Beobachtung konnten Geyer und Welteke (2021) mit neueren Daten bestätigen. 
In Bezug auf den Zugang zu Erwerbsminderungsrenten ist kein Reformeffekt zu 
erkennen, der Anteil der Frauen in Arbeitslosigkeit und Nichterwerbstätigkeit stieg 
bei der Kohorte 1952 ab dem Alter 60 leicht an, wohingegen er für die Kohorte 
1951 gleichbleibend war bzw. sank (vgl. Geyer et al. 2019). 

Diese gemessenen Effekte könnten jedoch durch verschiedene Faktoren beein- 
flusst werden. Darunter fallen z.B. die finanzielle Situation im Haushalt, Gesund- 
heit und Bildungsstand der Frauen. Um die Heterogenität untersuchen zu können, 
ergänzten Geyer et al. (2018, 2019) die Analysen der Rentenversicherungsdaten 
mit einer Analyse aus dem Mikrozensus. Dieser Datensatz eignet sich insbesonde- 
re aufgrund des für einen Survey großen Stichprobenumfangs (370.000 deutsche 
Haushalte und 830.000 Personen pro Jahr). Dadurch ist das Sample auch bei der 
speziellen Zielpopulation der Frauen der Geburtskohorten 1951 und 1952 ausrei- 
chend groß. Des Weiteren erlauben die Daten Beobachtungen auf Haushaltsebene 
wie Arbeit, Bildung und Einkommen aller Haushaltsmitglieder sowie das Haus- 
haltseinkommen. Da die Daten des Mikrozensus jedoch keine Information darüber 
enthalten, ob eine Frau zum Bezug der Altersrente für Frauen berechtigt wäre, kön- 
nen die Ergebnisse der beiden Analysen nur bedingt verglichen werden. 
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Abbildung 6: Substitutionseffekte nach Gruppen 
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Quelle: eigene Darstellung in Anlehnung an Geyer et al. (2019) 
Daten: FDZ der Statistischen Ämter des Bundes und der Länder, Mikrozensus, 2011-2015 


Die Analyse des Mikrozensus zeigt, dass der Haushaltskontext einen wesentlichen 
Einfluss auf die relativen Beschäftigungswirkungen (Substitutionseffekte, siehe 
Abbildung 6) hat. Diese geben an, mit welchem Status (Beschäftigung, Arbeits- 
losigkeit, Nichterwerbstätigkeit) Frauen der Alterskohorte 1952 den verschobenen 
Renteneintritt ersetzen. 

So sind unter den alleinstehenden Frauen rund 58% in Beschäftigung vergli- 
chen mit 50% der Frauen in einer Partnerschaft. Noch deutlicher zeigt sich der 
Haushaltseffekt beim Anteil der Frauen in Arbeitslosigkeit oder Nichtbeschäfti- 
gung. Viele Frauen der beobachteten Kohorte, die in einer Partnerschaft leben, 
sind durch ihren Partner finanziell abgesichert. Dadurch weisen sie andere Er- 
werbsmuster auf als alleinstehende Frauen, und es besteht häufig kein Anspruch 
auf Versicherungsleistungen (Arbeitslosengeld I) bzw. das bedarfsgeprüfte Ar- 
beitslosengeld II kann nicht in Anspruch genommen werden, da das Haushalts- 
einkommen zu hoch ausfällt. So erklärt sich, dass für diese Gruppe der Anteil der 
Nichterwerbstätigen mehr als doppelt so hoch ist und der Anteil der Arbeitslosen 
nur knapp ein Drittel des Anteils der alleinstehenden Frauen ausmacht. 
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Einen noch deutlicheren Fffekt hat der Bildungsabschluss der Frauen. Hier 
konnten Geyer et al. (2019: 244) zeigen, dass bei Frauen mit hohem Bildungsab- 
schluss „der Rückgang der Verrentung [...] zu mehr als 70 Prozent durch einen An- 
stieg der Beschäftigung ausgeglichen [wird]“. Dies ist nur bei der Hälfte der Frauen 
mit niedrigem Bildungsabschluss der Fall. In dieser Gruppe wird der verschobene 
Renteneintritt ebenso häufig durch Arbeitslosigkeit oder Nichterwerbstätigkeit 
substituiert. 

Auch das zweite Beispiel zeigt, dass eine gelungene Kombination aus adminis- 
trativen und Befragungsdaten meist die jeweiligen Schwächen der beiden Daten- 
formen abfedern kann. Dennoch zeigen sich in beiden Beispielen Probleme bei der 
Vergleichbarkeit der gewünschten Zielpopulation. 


4 Ausblick - Record-Linkage und Entwicklungen im Bereich 
administrativer Daten 


4.1 Record-Linkage 


Um auf die Diskrepanzen zwischen Umfrage- und administrativen Daten zu reagie- 
ren, gibt es bereits mehrere Beispiele für Datensätze, in denen Befragungs- und 
administrative Daten mittels „Record-Linkage“ direkt verknüpft werden. Hierbei 
erteilen die Befragten ihr schriftliches Einverständnis zur Verknüpfung, z.B. von Be- 
fragungsdaten mit ihrem Rentenversicherungskonto, und geben in der Befragung 
ihre Sozialversicherungsnummer an. Anhand dieser werden die administrativen 
Daten so aufbereitet, dass sie mit den Befragungsdaten verknüpft werden können, 
ohne dass datenschutzrechtliche Grundsätze verletzt werden. Dies ermöglicht ein 
Anspielen der Daten des FDZ-RV an die thematisch vielfältigeren Befragungsdaten 
auf Haushaltsebene. Somit werden die Vorteile beider Datenarten kombiniert (vgl. 
Börsch-Supan et al. 2020; Lüthen et al. 2022). Derzeit bietet das FDZ-RV Daten 
zur Verknüpfung mit drei Datenquellen an, den Panel-Surveys SHARE und SOEP, 
sowie mit Daten der Bundesagentur für Arbeit (BASiD). Tabelle 2 gibt einen Über- 
blick über die Datensätze SHARE-RV und SOEP-RV, Population und Merkmale der 
verknüpfbaren Daten sowie die Anzahl der Fälle, die verknüpfbar sind. 
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Tabelle 2: Record-Linkage - Datenangebot des FDZ-RV (Stand Juni 2022) 


SHARE-RV SOEP-RV 
VSKT: 2020 VSKT: 2020 
FDZ-RV Daten RTBN: 2020 RTBN: 2020 
- Survey of Health, Ageing and Retire- | - Sozio-oekonomisches Panel (SOEP) 


Externe Daten | nent in Europe (SHARE) 


Population Bevölkerung in der Altersgruppe 50plus | Wohnbevölkerung in Deutschland 
- Soziodemografie - Soziodemografie 
- wirtschaftliche und gesundheitliche - Einstellungen, Werte und Persön- 
Merkmale ex- Lage lichkeit 
tëre Daten - Renten(anwartschaften) der 2. und - Gesundheit und Zufriedenheit 
3. Säule — Haushaltskontext und soziale Netz- 
— Haushaltskontext und soziale Netz- werke 
werke 
VSKT: 4.482 VSKT: 14.494 
Fallzahl 
RTBN: 3.358 RTBN: 4.023 


Forschende müssen die Daten der Projektpartner und die administrativen Daten 
der Rentenversicherung separat bestellen, sie können aber leicht von den Nutzen- 
den selbst verknüpft werden. 


4.2 Aktuelle Entwicklungen im Bereich administrativer Daten 


Die Bereitstellung administrativer Daten hat durch die in Abschnitt 1 erwähnte 
Gründung und Vernetzung von Forschungsdatenzentren deutlich an Dynamik ge- 
wonnen. Immer mehr öffentliche Einrichtungen stellen bereits Daten für die wis- 
senschaftliche Nutzung zur Verfügung oder arbeiten daran. Dabei zeigen sich eine 
große Kooperationsbereitschaft und ein Interesse vonseiten der Forschungsdaten- 
zentren, ihre Daten im Rahmen der gesetzlichen Möglichkeiten untereinander ver- 
knüpfbar zu machen. 

Derzeit gibt es z.B. Sondierungen, die Daten der Rentenversicherung mit 
weiteren Befragungen wie der Nationalen Kohorte sowie Daten anderer Sozialver- 
sicherungen wie der Bundesagentur für Arbeit zu verknüpfen. Sollte es gelingen, 
thematisch relevante Informationen verschiedener administrativer Einrichtungen 
verknüpfbar zu machen, würde das viele neue Forschungsmöglichkeiten eröffnen. 
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Wie im Kapitel von Marc Andre Kellert, Jessica Gröber und Dirk Hofäcker (Kap. 2.1) 
kurz erläutert, kann die Nutzung von quantitativen Daten auch in bildungswissen- 
schaftlichen Studiengängen Sinn machen. Es gibt eine Vielzahl an bereits erhobe- 
nen quantitativen Daten, zu denen auch Studierende Zugang haben. Nun stellt sich 
die Frage: Wie konkret kommen Studierende an diese Daten heran, und wie kön- 
nen diese ausgewertet werden? Ich werde versuchen, im Folgenden diese Fragen 
zu beantworten. In diesem Kapitel möchte ich daher zeigen, wie der Zugang und 
dann die Analyse von quantitativen Daten durchgeführt werden können. 

Dies geschieht hier mit einem Fokus auf der Sozialen Arbeit mit älteren Men- 
schen. Im Speziellen möchte ich auf das Thema Gesundheit im Alter eingehen. Da- 
bei werde ich vorstellen, wie untersucht werden kann, inwiefern sich die subjektive 
Gesundheit von älteren Frauen und Männern unterscheidet. Allerdings ist die Ziel- 
gruppe des Kapitels nicht auf Studierende der Sozialen Arbeit beschränkt, sondern 
kann auch Studierenden anderer sozial- und bildungswissenschaftlicher Studien- 
gänge und weiterer Disziplinen beim Umgang mit quantitativen Daten helfen. 

Dazu werde ich anhand von zwei Datensätzen — dem Deutschen Alterssurvey 
(DEAS) und dem European Social Survey (ESS) — exemplarisch vorführen, wie 
eine (sehr einfache) Analyse zum Thema Gesundheit im Alter ausgeführt werden 
kann. Ich gehe auf den Datenzugang, die Datenauswertung und die Darstellung 
der Ergebnisse ein. Hierfür werde ich zuerst die beiden Datensätze beschreiben, 
dann vorstellen, wie Studierende den Zugang zu diesen erhalten können, wie man 
anhand von Fragebögen und Codebooks die richtigen Variablen zum eigenen For- 
schungsthema findet und diese schließlich auswerten kann. 

Weiterhin sollen verschiedene Analysemöglichkeiten mit den beiden Daten- 
sätzen — z.B. klassische Regressionen, Panelanalysen, Mehrebenenregressionen 
und Clusteranalysen — kurz vorgestellt werden. Abschließend wird ein Überblick 
über weitere Datensätze (z.B. SHARE) gegeben. Am Ende stehen eine Zusammen- 
fassung und ein Ausblick. 
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Mit dem Kapitel hoffe ich, Studierenden die vielfältigen Möglichkeiten 
einer Analyse bereits erhobener Daten für Master- und Bachelorarbeiten, aber 
auch für Hausarbeiten und andere Prüfungsleistungen, näherzubringen. Es geht 
zudem darum - aus meiner Sicht -, unnötige Bedenken und Ängste im Umgang 
mit quantitativen (Sekundär-)Daten abzubauen. Quantitative Sekundärdaten — 
gerade auch das DEAS und ESS - bieten für Studierende die Chance, mit Daten zu 
arbeiten, die von Expert:innen im Feld, die langjährige Erfahrungen im Umgang 
mit quantitativen Daten haben, erhoben wurden. Dies hat aus meiner Sicht mehrere 
Vorteile: Erstens spart man sich den „Aufwand“, Daten selbst zu erheben. Gerade 
bei einer Master- oder Bachelorarbeit, die bereits eine Herausforderung darstellt, 
kann dies eine große Entlastung bedeuten. Zweitens birgt die eigene Erhebung 
immer auch einige Risiken: „Funktioniert“ beispielsweise der Fragebogen oder 
nehmen genug Personen an der Erhebung teil? Drittens ist die Qualität von bereits 
erhobenen Sekundärdaten meist hoch, und es existieren genaue Dokumentatio- 
nen und Beschreibungen der Daten. Man kann also mit der Datenanalyse direkt 
anfangen, ohne den Datensatz lange aufbereiten zu müssen. Und viertens haben 
schon andere Wissenschaftler:innen mit den Daten gearbeitet. Man kann sich also 
an deren Studien orientieren. 


Die beiden Datensätze: DEAS und ESS 


Im folgenden Abschnitt werde ich nun die beiden Datensätze DEAS und ESS nä- 
her vorstellen. Dabei wird auf deren Ziele, Aufbau und Inhalte eingegangen. Der 
Datenzugang wird im nächsten Kapitel beschrieben 


DEAS 


„Der DEAS ist die bedeutendste Langzeitstudie zum Thema Alter und 
Altern in Deutschland und wird seit Mitte der 1990er Jahre aus Mit- 
teln des Bundesministeriums für Familie, Senioren, Frauen und Jugend 
(BMFSEJ) gefördert. Er stellt die zentrale Informationsgrundlage für 
politische Entscheidungsträgerinnen und Entscheidungsträger, aber 
auch für die interessierte Öffentlichkeit und für die wissenschaftliche 
Forschung dar. Der DEAS ist eine bundesweit repräsentative Langzeitbe- 
fragung von Personen im Alter von 40 bis 85 Jahren. Insgesamt werden 
die Befragten zu folgenden Themenbereichen um Auskunft gebeten: 
Arbeit und Ruhestand; Generationen, Familie und soziale Netzwerke; 
außerberufliche Tätigkeiten und ehrenamtliches Engagement; Wohnen 
und Mobilität; wirtschaftliche Lage und wirtschaftliches Verhalten; Le- 
bensqualität und Wohlbefinden; Gesundheit und Gesundheitsverhalten, 
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Hilfe- und Pflegebedürftigkeit sowie Einstellungen, Normen, Werte und 
Altersbilder.“ (Mahne et al. 2017: 11f.) 


Im Mittelpunkt des DEAS stehen also ältere Menschen und deren Leben. Wie im 
obenstehenden Zitat beschrieben, umfasst die Befragung dabei unterschiedlichste 
Lebensbereiche. So lässt sich beispielweise mit dem DEAS untersuchen, wie es um 
die Gesundheit bei älteren Menschen bestellt ist. Spuling et al. (2019) kommen, 
basierend auf Daten des DEAS, zum Ergebnis, dass sich mit steigendem Alter die 
Gesundheit verschlechtert, Unterschiede zwischen Männern und Frauen in der Ge- 
sundheit bestehen und jüngere (Geburts-)Kohorten wahrscheinlich eine bessere 
Gesundheit aufweisen als ältere. Auch die Lebenszufriedenheit älterer Menschen 
in Deutschland lässt sich mit dem DEAS untersuchen. „Die Lebenszufriedenheit 
nimmt im höheren Alter etwas ab, und das Depressionsrisiko steigt an. Diese Ver- 
änderungen fallen bei Frauen deutlicher aus als bei Männern (vgl. Wettstein et al. 
2019: 53). Mit dem DEAS lassen sich zudem die Themen Isolation und Einsam- 
keit untersuchen (vgl. Huxhold/Engstler 2019). „Die Risiken sozialer Isolation und 
Einsamkeit sind unterschiedlich hoch und entwickeln sich mit dem Älterwerden im 
Verlauf der zweiten Lebenshälfte verschieden: Während das Isolationsrisiko zwi- 
schen dem 40. und 90. Lebensjahr relativ kontinuierlich von vier auf 22 Prozent 
steigt, verläuft das Einsamkeitsrisiko u-förmig“ (ebd.: 71). 

Der DEAS besteht seit 1996, als die erste Welle erhoben wurde. Weitere Wel- 
len folgten 2002, 2008, 2011, 2014, 2017 und 2020/2021. Für die Erhebung wer- 
den persönlich-mündliche Interviews rechnergestützt durchgeführt (Computer 
Assisted Personal Interview, CAPI) und ein zusätzlicher schriftlicher Fragebogen 
(sogenannter Drop-off) eingesetzt (vgl. Mahne et al. 2017). Das infas Institut für 
angewandte Sozialwissenschaft GmbH führt die Erhebung durch. Das Besondere 
am DEAS ist das längsschnittliche Design. Das heißt, dieselben Befragten werden 
über mehrere Wellen hinweg befragt, was einen Vergleich „innerhalb“ einer Person 
über mehrere Zeitpunkte hinweg möglich macht. Es werden jedoch immer wieder 
neue Teilnehmer:innen rekrutiert; daher schwankt die Zahl der Befragten zwi- 
schen den Wellen. 2017 wurden 6.632 Menschen befragt (vgl. ebd.). 

Koordiniert (z.B. in der Konstruktion des Fragebogens oder durch die Bereit- 
stellung der Daten) wird das DEAS vom Deutschen Zentrum für Altersfragen (DZA 
https://www.dza.de/). Das DZA ist ein Bundesforschungsinstitut, das in seinen 
Studien gesellschaftliche Teilhabe im Lebenslauf thematisiert und dabei insbeson- 
dere die zweite Lebenshälfte in den Blick nimmt. Es wird vom Bundesministerium 
für Familie, Senioren, Frauen und Jugend gefördert. Neben dem DEAS werden hier 
noch weitere Erhebungen organisiert (siehe weiter unten). 
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ESS 


„Das European Social Survey (ESS) ist eine länderübergreifende Be- 
fragung, die seit 2002 im Zwei-Jahres-Rhythmus durchgeführt wird. In 
jeder Welle des ESS werden für alle beteiligten Länder repräsentative 
Bevölkerungsstichproben gezogen. Ein Teil der Fragen bleibt dabei in 
jeder Welle gleich und wird durch Fragen zu wechselnden thematischen 
Schwerpunkten ergänzt. Dabei werden im ESS sehr hohe methodische 
Standards sowohl bei der Erstellung des Fragebogens als auch bei der 
Stichprobenziehung und Datenerhebung eingehalten.“ (Adriaans et al. 
2019: 821) 


Themen im ESS sind neben Soziodemografie auch Einstellungen und Werte. Mit 
Daten des ESS können unterschiedlichste Analysen durchgeführt werden. So kann 
beispielweise der Zusammenhang zwischen Einkommen und Lebenszufriedenheit 
untersucht werden; Ismyrlis und Moschidis (2018) zeigen, dass das Einkommen 
einen positiven Einfluss auf die Lebenszufriedenheit hat. Auch Gerechtigkeitsvor- 
stellungen wurden im ESS erhoben. So kommen Adriaans et al. (2019) zu dem 
Ergebnis, dass die Mehrheit der Menschen in Europa ein Leistungs- und Bedarfs- 
prinzip befürwortet. Mit dem ESS lässt sich außerdem untersuchen, wie demo- 
grafische und wirtschaftliche Entwicklungen mit Einstellungen zusammenhängen. 
Basierend auf den Daten kann z.B. vermutet werden, dass eine wirtschaftliche Re- 
zession zu negativen Einstellungen bezüglich Immigration führt (vgl. Vogt Isaksen 
2019). Ebenso wurde das Thema Diskriminierung - hier Altersdiskriminierung — 
mit dem ESS untersucht. Kim und Jung (2021: 214) kommentieren: „We find that 
ageism is negatively related to measures of wellbeing (happiness, life satisfaction, 
self-rated health). More importantly, the relationship is less pronounced in coun- 
tries with higher levels of religiosity.“ Ebenso kann die Wahlbeteiligung mit ESS- 
Daten untersucht werden. Fieldhouse et al. (2017) finden, dass überall in Europa 
jüngere Menschen seltener zur Wahl gehen als ältere. 

Betreut wird der ESS durch ein Konsortium verschiedener Forschungsinstitu- 
tionen in Europa; in Deutschland ist dies GESIS - Leibniz Institute for the Social 
Sciences. Am ESS nehmen über 30 Länder teil; pro Land sind dies 1.500 Befragte 
bzw. 800 Befragte in Ländern mit weniger als zwei Millionen Einwohner:innen. Die 
Datenerhebung erfolgt mittels persönlich-mündlicher Interviews. Im ESS werden 
Personen, die älter als 14 Jahre sind, befragt. 
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Datenzugang 


Im folgenden Abschnitt soll kurz erläutert werden, wie Studierende Zugang zu den 
Daten des DEAS und ESS erhalten. Vorab sei erwähnt, dass es anzuraten ist, sich 
zunächst Gedanken darüber zu machen, was man mit den Daten erreichen will, 
bevor man den Datenzugang beantragt; obwohl es auch sehr viel Spaß bereiten 
kann, ohne Ziel in den Daten zu „stöbern“. Für Studierende, die Haus-, Bachelor- 
oder Masterarbeiten schreiben, ist jedoch ein geplantes Vorgehen absolut zu emp- 
fehlen. Das heißt, man sollte zuerst überlegen, was man untersuchen möchte und 
wie die Forschungsfrage lautet. Dann sollte man sich damit auseinandersetzen, ob 
eine Analyse mit Sekundärdaten sinnvoll ist und, falls ja, mit welchen. Hier kann 
ein Blick in die Fragebögen und Methodenberichte (siehe nächsten Abschnitt) hilf- 
reich sein. Erst wenn man sich (halbwegs) sicher ist, dass die Sekundärdaten die 
Forschungsfrage beantworten können, sollte man sich die Daten „besorgen“. 


Datenzugang DEAS 


Für die Nutzung der DEAS-Daten ist es zunächst notwendig, einen Datennut- 
zungsantrag zu stellen. Dieser findet sich auf der Website des DEAS (https:// 
www.dza.de/forschung/fdz/deutscher-alterssurvey/deas-datennutzung [Zugriff: 
06.03.2022]). Der Antrag ist relativ kurz und überschaubar. 


Auf der Website steht zum Personenkreis, der DEAS-Daten nutzen darf: 


„Es sind ausschließlich Anträge zulässig, wenn die Daten für wissen- 
schaftliche Forschung ohne gewerblichen Zweck genutzt werden sollen. 
Wissenschaftlerinnen und Wissenschaftler an Hochschulen und öffent- 
lich geförderten Forschungseinrichtungen sowie Hochschulabsolven- 
tinnen und -absolventen und Studierende für Qualifikationsarbeiten zur 
Erlangung eines akademischen Abschlusses (ab Masterarbeit) können 
einen Nutzungsantrag stellen. Für Bachelorarbeiten ist der Nutzungs- 
antrag durch das betreuende Hochschulmitglied zu stellen.“ 


Das heißt, DEAS-Daten können für Bachelor- und Masterarbeiten genutzt werden, 
für erstere muss der Antrag allerdings vom betreuenden Hochschulmitglied ge- 
stellt werden. Wenn der Antrag als gültig bewertet wird, erhält die antragstellende 
Person einen Benutzernamen und ein Passwort, mit dem sie sich im Downloadbe- 
reich die Daten und das Dokumentationsmaterial herunterladen kann. Die Daten 
stehen in verschiedenen Formaten für einschlägige Statistikprogramme (SPSS®, 
Stata®) bereit. Die Nutzung der DEAS-Daten ist kostenlos. 
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Datenzugang ESS 


Für die Nutzung des ESS ist es notwendig, sich als Nutzer:in zu registrieren. Dies 
lässt sich denkbar einfach auf der Website http://www.europeansocialsurvey.org/ 
user/new (Zugriff: 06.03.2022) umsetzen. Die Daten sind für nichtkommerzielle 
Zwecke nutzbar, d.h. für Haus-, Bachelor- und Masterarbeiten. Nach der Regist- 
rierung lassen sich die Daten mit dem Benutzernamen und einem Passwort her- 
unterladen. Die Daten sind ebenfalls in verschiedenen Formaten für einschlägige 
Statistikprogramme verfügbar und kostenlos nutzbar. Das ESS bietet darüber hi- 
naus die Möglichkeit, einfache Analysen online durchzuführen. Dies kann unter 
http://nesstar.ess.nsd.uib.no/webview/ (Zugriff: 06.03.2022) erfolgen. Hier las- 
sen sich Kreuztabellen und einfache Korrelationsanalysen berechnen. Unter Um- 
ständen kann es sinnvoll sein, sich die relevanten Variablen vor der Registrierung 
und Bestellung online „anzuschauen“, d.h., eine Häufigkeitsauszählung der Vari- 
ablen durchzuführen. So kann beispielsweise festgestellt werden, ob die Fallzahlen 
bei den relevanten Variablen für die geplanten Analysen hoch genug sind. 


Datenvorbereitung und -analyse 


In den folgenden zwei Kapiteln möchte ich nun exemplarisch anhand der beiden 
oben beschriebenen Datensätze die folgende Frage untersuchen. Wie unterschei- 
det sich die subjektive Gesundheit von älteren Frauen und Männern? 

Bei jeder Datenvorbereitung und -analyse ist es ratsam, zuerst einen Plan zu 
erstellen: bevor man sich an die Daten „setzt“: Was ist das Ziel der geplanten Ana- 
lysen und wie soll dieses erreicht werden? Dies sollte man schriftlich festhalten. 
Auch ist es ratsam, so viel wie möglich bei der Datenvorbereitung und -analyse zu 
dokumentieren - handschriftlich oder auch digital —, also aufzuschreiben, was und 
warum man was gemacht hat. So weiß man immer, wo man steht, und so können 
später die Datenvorbereitung und -analyse nachvollzogen werden. 

Als ersten Schritt bei der Datenvorbereitung sollte man identifizieren, wel- 
che Variablen man für die Analyse benötigt. Dies sollte aus der Forschungsfrage 
abgeleitet werden. Im vorliegenden Fall möchten wir die subjektive Gesundheit 
untersuchen. Wir brauchen also eine Variable, die eine Aussage über die subjekti- 
ve Gesundheit zulässt. Wir möchten diese Aussage auf ältere Menschen beziehen. 
Daher ist eine Variable notwendig, die das Alter der Befragten wiedergibt. Und 
schließlich wollen wir zwischen Frauen und Männern unterscheiden. Eine Variab- 
le für Geschlecht ist also erforderlich. Wie findet man nun diese Variablen? Hierzu 
bestehen unterschiedliche Möglichkeiten. Meiner Erfahrung nach hilft ein Blick in 
den Fragebogen oder den Methodenbericht der Erhebung. Oft kann man über das 
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Inhaltsverzeichnis schnell den Abschnitt finden, in welchem sich die gewünschte 
Frage (Variable) befindet. Ebenso hilfreich kann die Suchfunktion (strg+f) sein. 
Im vorliegenden Fall könnte man z.B. den Fragebogen nach dem Wort „Gesund- 
heit“ durchsuchen. Die Identifikation der gewünschten Variablen kann manchmal 
etwas Zeit beanspruchen, ist jedoch sinnvoll, bevor man sich den Datenzugang ver- 
schafft. 

Hat man nun die gewünschten Variablen identifiziert (und dies dokumen- 
tiert), müssen diese eventuell noch bearbeitet werden. Bei einfachen Analysen ist 
dies oft schnell erledigt, bei komplizierten kann dies aufwendiger sein. Die Daten- 
bearbeitung kann beispielsweise die Recodierung von Ausprägungen der Variablen 
oder auch das Löschen von für die Analyse nicht relevanten Fällen beinhalten. 

Wie die Datenvorbereitung sollte auch die Datenauswertung geplant und do- 
kumentiert werden. Oft ist die eigentliche Analyse der Daten weniger aufwendig 
als deren Vorbereitung. Im vorliegenden Fall besteht diese im Kern aus einer ein- 
fachen Kreuztabelle mit dem Geschlecht in den Zeilen und der subjektiven Gesund- 
heit in den Spalten. Weiterhin kann die durchschnittliche Gesundheit für Männer 
und Frauen berechnet werden. 


DEAS 


Für die Datenvorbereitung habe ich die Daten der ersten Welle des DEAS gewählt 
(vgl. Engstler/Lejeune 2021). Diese wurden 1996 erhoben. 

Zur Suche der drei relevanten Variablen subjektive Gesundheit, Alter und Ge- 
schlecht nutze ich den Methodenbericht (zu finden auf https://www.dza.de/for- 
schung/fdz/deutscher-alterssurvey/deas-dokumentation [Zugriff: 02.04.2022]). 
In diesem lassen sich mit der Suchfunktion (strg+f) und den Suchwörtern Ge- 
sundheit, Alter und Geschlecht die drei Variablennamen v30_11 (subjektive Ge- 
sundheit), v1_11 (Geschlecht) und alter_96 identifizieren. Die Variablev30_11 hat 
die Ausprägungen 1(=sehr gut), 2(=gut), 3(=mittel), 4(=schlecht) und 5(=sehr 
schlecht), die Variable v1_11 hat die Ausprägungen 1(=männlich) und 2(=weib- 
lich) und die Variable alter_96 zeigt das Alter an. Teilweise gibt es auf den Aus- 
prägungen fehlende Angaben; d.h., hier gab es keine Antwort. Fehlende Angaben 
können für Auswertungen ein Problem darstellen; ein klassisches Beispiel ist das 
Thema Einkommen (Rässler 2000). Dazu verweigern verhältnismäßig viele Be- 
fragte die Auskunft, und dementsprechend fehlen viele Angaben. Zum Umgang 
mit fehlendenden Werten gibt Spieß (2010) Auskunft. Für die vorliegenden Ana- 
lysen sind die fehlenden Angaben aber vernachlässigbar. Bei Alter und Geschlecht 
sind die Angaben vollständig, bei der subjektiven Gesundheit weisen von 4.838 Be- 
fragten fünf fehlende Werte auf. Für die Analysen werden diese fünf Befragten aus 
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dem Datensatz gelöscht. Weiterhin wird der Datensatz auf Befragte beschränkt, die 
älter als 50 Jahre sind; damit ist die Datenvorbereitung abgeschlossen. 

Die Datenauswertung besteht aus einem einfachen Kreuztabellenbefehl mit 
subjektiver Gesundheit und Geschlecht sowie einer Gegenüberstellung der Durch- 
schnittswerte für subjektive Gesundheit von Frauen und Männern. 


ESS 


Für die Datenvorbereitung habe ich die Daten der vierten Welle des ESS gewählt 
(ESS 2008). Diese wurden 2008/2009 erhoben; das Thema des „Rotating Modu- 
les“ dieser Welle ist Altersdiskriminierung. „Rotating Modules“ sind zusätzlich zu 
den Kernfragen des ESS gestellte Fragen zu einem bestimmten Thema, welches nur 
in einer Welle erhoben wird. 

Für die Datenvorbereitung im ESS sollten zuerst wieder die drei relevanten Va- 
riablen gesucht werden. Hier stelle ich ein alternatives und schnelleres (aber auch 
fehleranfälligeres, da man nicht die detaillierte Beschreibung der Variablen wie im 
Methodenbericht vorliegen hat) Vorgehen vor: direkt im Datensatz mit der Such- 
funktion nach den Begriffen age, health und gender zu suchen.'! So kommt man auf 
die Variablen gndr (Geschlecht), agea (Alter), und health (Subjektive Gesundheit). 
Die Variable gndr hat die Ausprägungen 1(=male) und 2(=female), die Variable 
agea zeigt das Alter der Befragten an. Die Variable health hat die Ausprägungen 
1(=very good), 2(=good), 3(=fair), 4(=bad) und 5(=very bad). In allen Variab- 
len sind die fehlenden Angaben mit „.a“ codiert. 

Für die Datenvorbereitung werden nun drei Schritte durchgeführt. Zuerst 
werden alle Befragten gelöscht, die auf einer der drei Variablen fehlende Anga- 
ben aufweisen. Zweitens soll die Variable zur subjektiven Gesundheit „vereinfacht“ 
werden, damit die Datendarstellung übersichtlicher ist. Dafür werden die Ausprä- 
gungen 1(=very good) und 2(=g00d) sowie 3(=fair), 4(=bad) und 5(=very bad) 
zusammengefasst. Hierfür generiert man am besten eine weitere Variable (z.B. mit 
dem Namen neuhealth), die dann aus zwei Ausprägungen 1(=gut) und 2(=nicht 
gut) besteht. Weiterhin wird der Datensatz auf Befragte beschränkt, die älter als 
50 Jahre sind. 

Die Datenauswertung besteht aus einem einfachen Kreuztabellenbefehl mit 
subjektiver Gesundheit und Geschlecht. 


1 Dies kann bei einfachen Analysen eine Möglichkeit sein, sich schnell einen ersten Über- 
blick zu verschaffen. 
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Ergebnisse und Datendarstellung 


Im Folgenden werden verschiedene Möglichkeiten dargestellt, wie Ergebnisse prä- 
sentiert werden können. Sowohl für die Analysen mit dem DEAS als auch dem ESS 
wird auf Gewichten verzichtet.? 


DEAS 


Die Ergebnisse der DEAS-Daten stehen in Tabelle 1. Es zeigt sich, dass die Unter- 
schiede nach Geschlecht relativ gering sind. Männer geben leicht bessere Werte für 
ihre subjektive Gesundheit an. Dieses Ergebnis findet sich bereits in früherer For- 
schung (vgl. Gunzelmann et al. 2006). Abbildung 1 zeigt eine Möglichkeit, diese 
Ergebnisse als Säulendiagramm darzustellen. 


Tabelle 1: Subjektive Gesundheit, unterschieden zwischen Männern und Frauen (Werte in Prozent, 
eigene Berechnung, basierend auf ungewichteten Daten des DEAS, N=3.651) 


Gesundheitszustand 
: Sehr 
Sehr gut Gut Mittel Schlecht Schlacht 
Frauen 5 39 41 13 2 
Männer 6 42 38 12 2 


Abbildung 1: Subjektive Gesundheit, unterschieden zwischen Männern und Frauen (Werte in Pro- 
zent, eigene Berechnung, basierend auf ungewichteten Daten des DEAS, N=3.651) 


45 


40 


5 
, E = 
Sehr gut Gut Mittel Schlecht Sehr schlecht 


E Frauen Manner 


2 Zum Thema Gewichten siehe Faas/Schön 2009. 
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Eine weitere Art der Darstellung ist der Vergleich über den Mittelwert der subjek- 
tiven Gesundheit zwischen Männern und Frauen. Diese sind 2.63 für Männer und 
2.69 für Frauen. Dies spiegelt die leicht schlechtere Gesundheit der Frauen wider, 
die sich in Tabelle 2 und Abbildung 2 findet. 


ESS 


Die Ergebnisse der ESS-Daten stehen in Tabelle 2. Beiden Männern gibt die Hälfte, 
bei den Frauen geben etwa 40 % eine gute subjektive Gesundheit an. Abbildung 2 
zeigt eine Möglichkeit, diese Ergebnisse als gestapelte Säulen wiederzugeben. Die 
Ergebnisse spiegeln diejenigen aus dem DEAS wider. 


Tabelle 2: Subjektive Gesundheit, unterschieden zwischen Männern und Frauen (Werte in Prozent, 
eigene Berechnung, basierend auf ungewichteten Daten des ESS, N=21.581) 


Subjektive Gesundheit 
Gut Nicht Gut 
Frauen 41 59 
Männer 50 50 


Abbildung 2: Subjektive Gesundheit, unterschieden zwischen Männern und Frauen (Werte in Pro- 
zent, eigene Berechnung, basierend auf ungewichteten Daten des ESS, N=21.581) 


Frauen Männer 


BGut E Nicht Gut 
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Weiteres Analysepotenzial 


Über die sehr einfach vorgestellten Analysemethoden in Form von Kreuztabellen 
hinaus existiert eine Vielzahl von weiteren statischen Methoden, mit welchen Da- 
ten untersucht werden können. Eine Auswahl, die nur einen sehr kleinen Anteil 
der Möglichkeiten widerspiegelt, möchte ich kurz vorstellen. Dabei ist zu beachten, 
dass diese Möglichkeiten nur sehr oberflächlich angerissen werden können, d.h., 
es werden weder die Bedingungen an die Daten der Analysemethoden noch wird 
die Ausführung der Analyse genau beschrieben. 

Beginnen möchte ich mit der Regressionsanalyse: „Die lineare Regressions- 
analyse markiert dabei den Grundstein vieler Verfahren. Mit Hilfe der linearen 
Regressionsanalyse können für eine Ergebnisvariable mit Hilfe von Prädiktorvaria- 
blen Vorhersagen getroffen werden“ (Hofäcker/Stegl 2021: 215). Die Regressions- 
analyse untersucht, wie zwei Variablen „zusammenhängen“. Ein Beispiel wäre der 
Zusammenhang zwischen Einkommen und Gesundheit. Die Studien zeigen, dass 
ein höheres Einkommen eine bessere Gesundheit „vorhersagt“. 


„Die multiple Regressionsanalyse testet, ob ein direkter Zusammenhang 
zwischen mehreren unabhängigen (Prädiktoren) und einer abhängigen 
Variable (Kriterium) besteht. Sie ist eine Erweiterung der einfachen Re- 
gression und ermöglicht es, mehrere unabhängige Variablen gleichzei- 
tigin einem Modell zu berücksichtigen. Die multiple lineare Regression 
ist das in der empirischen Forschung am weitesten verbreitete regres- 
sionsanalytische Verfahren.“ (Hofäcker/Stegl 2021: 252) 


So könnte man z.B. in einem Modell untersuchen, welcher Zusammenhang zwi- 
schen Einkommen, Rauchen, Alter (unabhängige Variablen) und Gesundheit (ab- 
hängige Variable) besteht. 

Weitere Formen der Regressionsanalyse sind die Mehrebenenanalysen (vgl. 
Langer 2010), welche die Analyse von Daten auf mehreren Ebenen ermöglichen. 
Hierfür sind Daten nötig, in denen die Untersuchungseinheiten einer bestimmten 
Gruppe zuordenbar sind. Ein Beispiel findet sich im ESS: Alle Befragten sind einem 
bestimmten Land zuordenbar. Die Mehrebenenanalyse erlaubt nun, die unabhän- 
gigen Variablen sowohl auf der Ebene der Befragten (z.B. Einkommen, Rauchen, 
Alter) als auch auf der Ebene der Länder (z.B. Anteil des Bruttosozialproduktes, 
das für Gesundheit verwendet wird) in die Analysen aufzunehmen. Weiterhin 
können Regressionsanalysen auch im Längsschnitt angewendet werden (vgl. Gies- 
selmann/Windzio 2013), beispielsweise mit den Daten des DEAS. So kann z.B. 
untersucht werden, wie sich etwa die Gesundheit eines:einer Befragten oder von 
Subgruppen über die Zeit verändert hat. 
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Neben der Regressionsanalyse gibt es eine Vielzahl an weiteren Methoden wie 
Clusteranalysen, Sequenzmusteranalysen oder Matching-Verfahren. 


Weitere Datensätze 


Neben dem DEAS und ESS bestehen noch viele weitere Datensätze. Im Folgenden 
möchte ich eine Auswahl dieser vorstellen, wobei gesagt werden muss, dass die 
Auswahl willkürlich getroffen wurde. Es gibt viele Datensätze, die ich nicht kenne 
und mit denen ich bisher nicht gearbeitet habe. Diese Datensätze sind sehr unter- 
schiedlich, was die Erhebung, Datenaufbereitung, das Thema und auch den Da- 
tenzugang betrifft — hier kann ich nicht immer garantieren, dass der Zugang für 
Abschlussarbeiten von Studierenden gegeben ist. Teilweise haben die Hochschu- 
len Zugang zu verschiedenen Datensätzen. Im Zweifelsfall kann ein:e Betreuer:in 
unterstützen. 

Für Deutschland sicherlich einer der spannendsten Datensätze ist das Sozio- 
oekonomische Panel (SOEP). Das SOEP ist wie das DEAS eine längsschnittliche 
Befragung. Die Befragung wird im jährlichen Rhythmus seit 1984 immer mit den- 
selben Personen und Familien durchgeführt, wobei neue Befragte über die Zeit hin- 
zukamen (vgl. Wagner et al. 2008). Die Befragten werden nicht nur zu objektiven 
Charakteristika wie z. B. ihrem Einkommen oder der Bildung, sondern auch zu sub- 
jektiven Charakteristika wie ihrer Lebenszufriedenheit befragt. 

Auch am DZA durchgeführt wird der Deutsche Freiwilligensurvey (FWS) (vgl. 
Simonson et al. 2017). Er ist eine repräsentative telefonische Befragung zum frei- 
willigen Engagement in Deutschland. Die Daten des Freiwilligensurveys wurden 
bislang fünfmal (1999, 2004, 2009, 2014 und 2019) erhoben. 

Das Beziehungs- und Familienpanel pairfam („Panel Analysis of Intimate Re- 
lationships and Family Dynamics“) ist wie das SOEP und DEAS eine Längsschnitt- 
studie zur Erforschung der partnerschaftlichen und familialen Lebensformen in 
Deutschland (vgl. Nauck et al. 2013). Der Fokus liegt auf Merkmalen der Partner- 
schaftsentwicklung und -gestaltung, der Familiengründung und -erweiterung, der 
intergenerationalen Beziehungen, des Erziehungsverhaltens und der kindlichen 
Entwicklung sowie der sozialen Einbettung. 

Bildungsprozesse stehen im Fokus des Nationalen Bildungspanels (NEPS), 
welches auch eine Längsschnittstudie ist. Ziel des NEPS ist es, Längsschnittdaten 
zu Kompetenzentwicklungen, Bildungsprozessen, Bildungsentscheidungen und 
Bildungsrenditen in formalen, nichtformalen und informellen Kontexten über die 
gesamte Lebensspanne zu erheben (vgl. Blossfeld et al. 2009). Mit ihm lassen sich 
unterschiedlichste Fragestellungen zum Thema Bildung über den gesamten Le- 
benslauf untersuchen. 
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Neben dem ESS existiert eine Vielzahl an weiteren Umfragen, die in mehre- 
ren Ländern durchgeführt werden, beispielsweise das Eurobarometer (EB); wobei 
strenggenommen das Eurobarometer nicht aus einer, sondern aus mehreren Um- 
fragen besteht (vgl. Bläser 2013). Auftraggeber ist die Europäische Kommission. 
Kerninhalte sind Fragen zur Europäischen Union. Daneben erfolgen weitere Um- 
fragen zu bestimmten Themen wie Umweltschutz oder Sicherheit. Das EB wird in 
allen Mitgliedstaaten der EU sowie teilweise in weiteren Ländern durchgeführt. 

Daten in afrikanischen Ländern werden im Afrobarometer gesammelt (vgl. 
Rauschenbach/Paula 2017). Aktuell sind dies über 30 afrikanische Länder, in 
welchen Befragte zu Themen wie Konflikt und Kriminalität, Demokratie, Wahlen, 
Gleichstellung der Geschlechter, Regierungsführung, Identität sowie Makroökono- 
mie und Märkte befragt werden. 

Eine weltweite Erhebung wird im World Values Survey (WVS) durchgeführt 
(vgl. Jen et al. 2010). In diesem werden in über 60 Ländern Menschen zu ihren Ein- 
stellungen und Werten befragt. Der WVS baut teilweise auf der European Values 
Study (EVS) auf. Zwischen den beiden bestehen Schnittmengen (vgl. European 
Value Study 2020). 

Speziell für die Forschung zu älteren Menschen soll hier zudem der Survey of 
Health, Ageing and Retirement in Europe (SHARE) erwähnt werden (vgl. Börsch- 
Supan et al. 2013). Der SHARE ist sowohl eine längsschnittliche als auch eine inter- 
nationale Befragung. In der letzten Welle der bisher acht Wellen wurden in tiber 
27 Ländern Menschen im Alter über 50 Jahren zu sozialen und familiären Netzwer- 
ken, Gesundheit und sozioökonomischem Status befragt. Viele der Befragten wer- 
den dabei nicht nur in einer der Wellen, sondern im Sinne der längsschnittlichen 
Struktur in mehreren Wellen befragt. Weitere Analysemöglichkeiten ergeben sich 
aus den SHARELIFE-Befragungen, in welchen die detaillierten Lebensgeschichten 
retrospektiv erfasst wurden. 

Der SHARE hat eine Reihe von ,,Schwersternstudien“, in welchen ebenso ältere 
Menschen (im Panel) befragt werden. Zu nennen sind beispielhaft die Health and 
Retirement Study (Vereinigte Staaten von Amerika), English Longitudinal Study 
of Ageing (England), Japanese Study of Aging and Retirement (Japan) und Longi- 
tudinal Aging Study in India (Indien). Einen guten Überblick erhält man über die 
Website https://g2aging.org/survey-overview (Zugriff: 04.03.2022). 

Weitere spannende Datensätze finden sich beispielsweise beim Forschungs- 
datenzentrum für die Bereitstellung und Archivierung sozialwissenschaftlicher 
Forschungsdaten der Universität Bremen. Hier werden qualitative Daten für die 
Zweitnutzung durch andere Forscher:innen aufgearbeitet und zur Verfügung ge- 
stellt. Es sei nochmal auf die GESIS - Leibniz-Institut für Sozialwissenschaften ver- 
wiesen. Dort finden die Verwaltung und Bereitstellung vieler Datensätze statt. Die 
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GESIS verfügt laut Stand vom 04.03.2022 über etwa 64.000 verschiedene Daten- 
sätze. 

Insgesamt kann festgehalten werden, dass es eine Vielzahl an kleinen und gro- 
ßen Datensätzen im Quer- und Längsschnitt, sowohl für Deutschland als auch für 
andere Länder, mit unterschiedlichsten Untersuchungsobjekten zu unterschied- 
lichsten Themen gibt. Und viele dieser Datensätze stehen für Haus-, Bachelor- und 
Masterarbeiten zur Verfügung. 


Zusammenfassung und Ausblick 


Ziel dieses Kapitels ist es, Studierenden zu zeigen, dass es mit (aus meiner Sicht 
relativ überschaubarem Aufwand) möglich ist, Zugang zu Sekundärdaten zu erhal- 
ten und diese für eine Haus- oder Abschlussarbeit zu nutzen. Hierzu wurde am Bei- 
spiel der beiden Datensätze DEAS und ESS dargestellt, wie Studierende die Daten 
erhalten können und eine einfache Analyse durchgeführt werden kann. Weiterhin 
wurden weitere Analysemethoden und Datensätze vorgestellt. 

Bei allem Positiven, was in diesem Kapitel bezüglich der Nutzung von Sekun- 
därdaten für Haus- und Abschlussarbeiten erwähnt wurde, müssen allerdings ei- 
nige Herausforderungen, die sich ergeben können, genannt werden. Erstens ist 
allein der Datenzugang noch keine Garantie für eine bestandene (gute) Haus- und 
Abschlussarbeit. Die Nutzung von Sekundärdaten bietet sich nur bei passenden 
Fragestellungen an. Die Fragestellung sollte klar sein, bevor man sich die Daten 
„besorgt“. Auch sollte geklärt werden, ob mit den Daten die Fragestellung beant- 
wortet werden kann. Ein Blick — wie weiter oben beschrieben - in den Fragebogen 
oder das Methodenbuch kann sehr nützlich sein. Zweitens braucht es (Grund-) 
Kenntnisse in der Bedienung von Analysesoftwaren wie SPSS®, Stata® oder SAS®. 
Sich diese erst während des Schreibens der Abschlussarbeit anzueignen, kann ris- 
kant sein, da dann möglicherweise die Zeit nicht reicht. Daher ist es ratsam, sich 
mit einer Analysesoftware schon im Laufe des Studiums vertraut zu machen. Drit- 
tens sollte man genug Zeit für die Vorbereitung und Analyse der Daten einplanen. 
Dies kann je nach Komplexität der angewandten Methoden länger dauern als ge- 
dacht. 

Ist man sich aber über diese Herausforderungen im Klaren, bieten Sekundär- 
datenanalysen unzählige Möglichkeiten für Haus- oder Abschlussarbeiten. Die Vor- 
teile liegen auf der Hand. Die Daten sind mit relativ wenig Aufwand relativ schnell 
zugänglich. Die Daten haben — meist — eine hohe Qualität, weil sie von Expert:in- 
nen mit oft langjährigen Erfahrungen erhoben werden. Ich kann daher jedem:je- 
der Studierenden, der:die ein gewisses Interesse an quantitativen Daten hat, nur 
raten, sich selbst an eine Datenanalyse zu wagen. Zum Schluss bleibt noch der Hin- 
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weis: Bitte immer die Datensätze zitieren, wenn man diese benutzt. Die Menschen, 
die die Erhebung durchführen, stecken in diese viel Arbeit. Das sollte anerkannt 
werden. 
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Einführung 


Soziale Netzwerkanalyse ist die Untersuchung von Interaktionsmustern zwischen 
sozialen Einheiten (Kilduff/Tsai 2003: 12). Sowohl in den Sozialwissenschaften 
als auch in den Wirtschaftswissenschaften hat die Untersuchung von sozialen 
Netzwerken in den letzten Jahrzehnten zu neuen Forschungserkenntnissen geführt 
(vgl. Schnegg 2010; Sydow 1992; Weyer 2011). Bei der sozialen Netzwerkanaly- 
se steht das Verständnis des Sozialen als Interaktions- und Beziehungssystem im 
Vordergrund. Hierbei sind die agents über Beziehungen miteinander verbunden 
(Kilduff 2003). Agents können Individuen sein, aber auch Organisationen bzw. In- 
stitutionen. Die Beziehungen zwischen den agents können sich auf die individuelle 
Ebene (Elternbeziehung, Freundschaftsbeziehungen, Bekanntschaft etc.) bezie- 
hen oder sich bei Organisationen und Institutionen um Ressourcen- und Koope- 
rationsbeziehungen handeln. Ansätze der Netzwerkforschung werden vor allem in 
den Bereichen der Sozialisations-, Jugend- und Familienforschung herangezogen. 
Auch in Rahmen von Begleit- und Evaluationsforschungen finden sich Forschun- 
gen zu sozialen Netzwerken. Eine enge Verknüpfung mit dem theoretischen Kon- 
zept des Sozialkapitals wird in den Sozial- und Bildungswissenschaften fokussiert. 

Insbesondere die Visualisierungen von Netzwerken in Netzwerkkarten können 
zur Aufdeckung von systematischen Beziehungsmustern herangezogen werden. 
Bei der Netzwerkvisualisierung geht es darum, binäre Beziehungen zwischen Enti- 
täten darzustellen. In Anlehnung an die Terminologie der Graphentheorie werden 
diese Entitäten als Knoten (engl. nodes) und die sie verbindenden Beziehungen als 
Linien bzw. Kanten (engl. edges) bezeichnet (Moreno 1934). Die Erhebung von 
Netzwerkdaten wird mittels einer quadratischen Matrix durchgeführt (vgl. Tab. 1). 
In den Zeilen der Matrix werden die Fälle eingetragen. Auch die Spalten der Matrix 
enthalten Informationen für den gleichen Fall in der gleichen Anordnung. Somit 
enthält jede Zelle innerhalb der Matrix die Beziehung zwischen zwei agents. Ein 
Beispiel zu einem Unterstützungsnetzwerk ist in Abbildung 1 dargestellt. Für eine 
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Gruppe der Adressaten, die bei den Maßnahmen einer sozialen Einrichtung zur 
Erhöhung der sozialen Teilhabe teilgenommen haben, werden die vorhandenen 
Beziehungen erhoben. Hierbei wird in der Matrix bei Vorhandensein von Unter- 
stützungsbeziehungen zwischen zwei Adressaten mit einer 1 und eine nicht vor- 
handene Beziehung zwischen den Netzwerkadressaten mit einer 0 notiert. Ist eine 
Matrix symmetrisch aufgebaut, d.h., das linke untere Dreieck lässt sich an der Dia- 
gonalen mit dem oberen rechten Dreieck spiegeln, handelt es sich um ungerichtete 
Beziehungen. Im Gegensatz hierzu zeigen gerichtete Beziehungen, in der Matrix- 
darstellung, eine Asymmetrie auf. Die oberen und unteren Dreiecke in der Matrix 
sind nicht mehr spiegelbildlich aufgebaut. 

Die Hauptdiagonale zeigt die Beziehungen der agents zu sich selbst und ist 
mit Nullen im Beispiel dargestellt. Im Beispiel wird nur zwischen vorhandener und 
nicht vorhandener Beziehung differenziert. Genauso gut ist es möglich, Angaben 
über die Stärke einer Beziehung, z.B. Häufigkeit der Kontakte in der Woche zwi- 
schen zwei Adressaten, einzutragen. 


Tabelle 1: Relationsgruppen in Matrixform ungerichtet (Datenauszug) 


Netzwerkkarte A1 A2 A3 A4 A5 
A 0 1 1 0 1 
A2 1 0 1 0 0 
A3 1 1 0 1 0 
A4 0 0 1 0 1 
A5 1 0 0 1 0 


Quelle: eigene Darstellung 


Ein Vergleich der Zeilen miteinander ermöglicht es, die Ähnlichkeit der Beziehun- 
gen im erhobenen Netzwerk zu untersuchen. Werden jedoch die Spalten mitei- 
nander verglichen, lässt sich die Einbettung bzw. die Position der Adressaten im 
Netzwerk veranschaulichen. Schließlich ist eine Untersuchung des gesamten Netz- 
werkes möglich, indem man die Anzahl der vorhandenen Beziehungen im Vergleich 
zu allen denkbaren bzw. möglichen Beziehungen betrachtet. Dieser Kennwert wird 
als Dichte von Netzwerken bezeichnet. 

Die Visualisierung von Netzwerken wird mithilfe sogenannter Soziogramme 
vorgenommen (vgl. Abb. 2). In dieser Abbildung werden die agents als Punkte und 
die Beziehungen als Linien dargestellt. Bei ungerichteten Beziehungen spricht man 
von Kanten (engl. edges), bei gerichteten Beziehungen von Pfeilen (engl. arcs), d.h., 
wenn eine Richtung vorhanden ist, werden diese als Pfeile dargestellt. 
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Abbildung 1: Soziogramme von ungerichteten (links) und gerichteten Beziehungen, exportiert aus 
VennMaker® 


Adfessat5 Adressat5 


Adressat Adressata 


Aressat2 Aressat2 
Adressati Adressati 


Adressat3 Adressat3 


Quelle: eigene Darstellung 


Es gibt verschiedene Softwareprogramme wie z.B. VennMaker®, Pajek® und UCI- 
NET®, die bei kleinen Netzwerken herangezogen werden können. Bei kleineren 
Netzwerken verlangt die Zusammensetzung der Netzwerke eine besondere Auf- 
merksamkeit. Insofern ist hier das Konzept der Nähe (Proximity), die sich grund- 
legend auf die Heterogenität der Stichprobe auswirkt, zu beachten. Bei großen 
Netzwerken können Visualisierungen leicht unübersichtlich werden. Die Darstel- 
lung, wie oben beschrieben, als Matrizenform dient als Basis für die Berechnung 
von Netzwerkmerkmalen, z.B. die Netzwerkdichte. 

Tabelle 1 zeigt die Beziehungsmatrix. Sie enthält die gleiche Anzahl an Zei- 
len und Spalten. Die erste Spalte und die erste Zeile enthalten die Bezeichnungen 
der agents. Die Matrix wird wie folgt gelesen: Adressat 1 hat zu Adressat 2 eine 
Beziehung. Die Beziehungsrichtung verläuft immer ausgehend von der jeweiligen 
Zeile hin zur jeweiligen Spalte. Da wir einen ungerichteten Graphen haben - die 
Beziehungen gehen jeweils in beide Richtungen -, ist auch die Matrix symmetrisch, 
das bedeutet, dass der Bereich oberhalb der von oben links nach unten rechts ver- 
laufenden Matrixdiagonalen auf die untere Matrixdiagonale gespiegelt werden 
kann. Nicht eingezeichnete Beziehungen werden in der Matrix als „O“ angezeigt. 
Mit VennMaker® können die folgenden netzwerkanalytischen Maßzahlberechnun- 
gen vorgenommen werden: Dichte (Density), Degree, Indegree, Indegree standardi- 
siert, Outdegree, Outdegree standardisiert, Incloseness, Outcloseness und Proximity 
Prestige. 
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Maßzahlen der sozialen Netzwerkanalyse 


Die Dichte gibt den Grad der Verbundenheit des Netzwerkes an. Die Netzwerkdichte 
ist definiert durch das Verhältnis zwischen den bestehenden Beziehungen zur An- 
zahl der grundsätzlich möglichen Beziehungen (vgl. Jansen 2006: 94). Die Dichte 
ergibt sich aus der Aufsummierung aller vorhandenen Kooperationsbeziehungen, 
bezogen auf die Zahl der maximal möglichen Kooperationen innerhalb eines erho- 
benen Netzwerkes. Es ergibt sich ein Wert zwischen O und 1, wobei ein Wert nahe 
Null auf eine niedrige Netzwerkdichte schließen lässt. Aus der Netzwerkdichte las- 
sen sind einige Implikationen für die Funktionsweise des Netzwerkes ableiten. Bei- 
spielsweise impliziert eine hohe Netzwerkdichte die Verbreitung von Innovationen, 
Neuigkeiten oder den Transfer von Ressourcen. SchülerInnen 

Indegree und Outdegree: Indegree und Outdegree gelten als einfache Maß- 
zahlen für Prestige, Popularität und soziale Unterstützung (vgl. Jansen 2006: 
96). Indegree spiegelt die Anzahl der eingehenden direkten Beziehungen des je- 
weiligen agent wider, während Outdegree die Anzahl der ausgehenden direkten 
Beziehungen misst. Damit die In- und Outdegreewerte zwischen unterschiedlich 
großen Netzwerken vergleichbar sind, werden diese Werte zusätzlich standardi- 
siert. Standardisierung bedeutet, dass die Gesamtanzahl der Knoten eines Netz- 
werkes herausgerechnet wird. Der standardisierte Degreewert (oder auch relativer 
Degreewert genannt) nimmt einen Wert zwischen 0 und 1 ein. 0 bedeutet einen 
geringen Degreewert, der agent ist mit keinem anderen agent verbunden, und ein 
Degreewert von 1 bedeutet, dass der agent mit allen anderen agents direkt ver- 
bunden ist. Closeness (Incloseness und Outcloseness) ist ein nähebasiertes Zentra- 
litätsmaß. Nähebasiert bedeutet in diesem Fall, dass die Pfaddistanzen aller direkt 
und indirekt verbundenen agents zu dem jeweiligen agent mit in die Berechnung 
einfließen. Alle unverbundenen Aagents werden bei der Closeness-Berechnung 
weggelassen (vgl. Wasserman/Faust 1994: 184f.). Bei gerichteten Beziehungen 
misst Incloseness die Beziehungen, die zu dem agent verlaufen. Outcloseness be- 
trachtet Beziehungen, die vom agent weggehen. Proximity Prestige berechnet, wie 
nahe der jeweilige agent zu den agents in seinem Einflussbereich ist. Hier wird 
Closeness allein über die Distanz des agent zu den agents in seinem Einflussbereich 
definiert. Wenn alle agents zu dem jeweiligen agent adjazent (benachbart) sind, 
dann hat Proximity Prestige einen Wert von 1. Wenn der agent zu keinem anderen 
agent verbunden ist, dann ist der Proximity-Prestige-Wert 0 (vgl. Wasserman/Faust 
1994: 203f.). 
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Netzwerktypen 


Bevor man zur Konzeption der Datenerhebung schreiten kann, sollte man sich Klar- 
heit darüber verschaffen, welche Art von Netzwerkdaten benötigt werden. Grund- 
sätzlich wird zwischen Gesamtnetzwerken und Ego-Netzwerken unterschieden. Bei 
Gesamtnetzwerken werden alle Beziehungen der agents, die im Hinblick auf eine 
Fragestellung relevant sind, erhoben. Die Untersuchung eines Gesamtnetzwerkes 
eröffnet die Möglichkeit, Strukturanalyseverfahren durchzuführen. Zentrale Stel- 
lungen von agents oder Gruppen von agents lassen sich durch Clusterbildung er- 
mitteln. Hierbei kann die Datenerhebung sehr viel Zeit und Kosten in Anspruch 
nehmen. Als Erhebungsverfahren können Befragungen, Beobachtungen und Meta- 
daten herangezogen werden. 

Für bestimmte Fragestellungen bietet sich anstelle einer Gesamtnetzwerkerhe- 
bung die Erhebung eines verankerten sozialen Netzwerkes um eine fokale Person 
an (vgl. Jansen 2006). Dabei wird ein einzelner agent (Ego) nach seinen Kontak- 
ten zu anderen (den sogenannten Alteri) und nach der jeweiligen Beziehungsform 
(Rolle) befragt. Hierbei werden anhand von Namensgeneratoren zusätzlich auch 
noch weitere Eigenschaften zu den vorhandenen Beziehungen, z.B. Geschlecht, 
Alter und Wichtigkeit der Unterstützungsleistung, abfragt. Unter Namensgenera- 
toren werden Abfragen verstanden, die einzelne agents (Egos) auffordern, eine 
begrenzte Anzahl von anderen agents zu benennen, mit denen sie verbunden 
sind. Der Vorteil einer Ego-Netzwerkerhebung besteht darin, dass multiplexe Be- 
ziehungsdimensionen simultan erhoben werden können. Der Nachteil der Ego- 
Netzwerke besteht darin, dass Positionen innerhalb des Gesamtnetzwerkes nicht 
ermittelbar sind. 

Multiplexität ist eine Beziehung zwischen zwei agents, die verschiedene In- 
teressen auf einmal erfüllt. Zwei Personen haben z.B. dann eine multiplexe Be- 
ziehung, wenn sie befreundet sind und sich in den gleichen Vereinen engagieren 
oder an den gleichen Maßnahmen teilnehmen. Mit diesen Informationen können 
Netzwerkforschende der Beziehung einen Wert in Abhängigkeit von der Anzahl der 
Interessen beimessen, die eine Beziehung repräsentiert. Eine Beziehung zwischen 
zwei Adressaten, die die gleichen Maßnahmen besuchen und eine gemeinsame 
Veranstaltung organisieren, würde demnach einen höheren Wert erhalten. 

Eine der einflussreichsten Netzwerkstudien stammt von Mark Granovetter 
(1974) mit dem Titel „Getting a Job“. Mit dieser Studie legte er die Grundlagen für 
seine Theorie „The Strength of Weak Ties“. Granovetter befragte in einer Vorstadt 
von Boston 300 Jobwechsler bezüglich des Stellenwechsels, der Einkommensmög- 
lichkeiten und der Zufriedenheit mit der Stelle. Ein besonderer Schwerpunkt lag 
zudem auf der Erhebung der persönlichen Kontakte, die im Kontext des Jobwech- 
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sels eine Rolle im Beziehungsgefüge eingenommen haben. In dieser Studie, die 
mithilfe von Ego-Netzwerken erhoben wurde, werden persönliche Netzwerke be- 
züglich ihrer Möglichkeiten zur Jobvermittlung ausgewertet. Die Ergebnisse zeig- 
ten, dass bei rund 65 % der Jobwechsel persönliche Kontakte eine außerordentlich 
wichtige Rolle gespielt haben. Insbesondere waren es die sogenannten schwachen 
Beziehungen, die sich als förderlich für neue Berufsperspektiven erwiesen haben. 
Häufig erhielten die Befragten den entscheidenden Hinweis für eine offene Stelle 
über einen arbeitsbezogenen Kontakt. Mithilfe von schwachen Beziehungen wer- 
den oftmals verschiedene Cluster oder heterogene Kontexte überbrückt. Während 
innerhalb von Clustern der Informationsgehalt wenig neuartig ist, steigt der In- 
formationsgehalt häufig mit der Entfernung zwischen den agents. Schwache Be- 
ziehungen haben wiederum den Nachteil, dass sie weniger verbindlich sind und 
die Vertrauensbasis weniger stark ausgeprägt ist. Es besteht daher ein umgekehrt 
proportionales Verhältnis zwischen der Hilfsbereitschaft von Personen, die sich 
nahestehen, zur Neuartigkeit der Information. Personen, die in größerer Distanz 
zueinander stehen, sind wiederum unter Umständen weniger hilfsbereit, dafür 
besitzen sie aber tendenziell wertvollere Informationen. Mit seiner Theorie der 
Stärke schwacher Beziehungen schafft Granovetter eine neue Perspektive auf die 
Einbettung von agents in Netzwerken: Es sind nicht unbedingt die intensiven, auf 
reziprokem Austausch basierenden Beziehungen, die die größten ökonomischen 
Vorteile versprechen, sondern die sogenannten schwachen Beziehungen. Nach 
Granovetter ist die Beziehungsstärke von drei Faktoren abhängig — verwendete Zeit 
(gemeinsam verbrachte Zeit der agents), emotionale Intensität sowie Reziprozität 
(Gegenseitigkeit der Beziehung). 

Zu den starken Beziehungen zählen jene Kontakte, die sich durch Häufigkeit, 
Regelmäßigkeit und durch Emotionen auszeichnen, z.B. Freundschaftsbezie- 
hungen oder Verwandtschaftsbeziehungen. Schwache Beziehungen sind durch 
seltenere und unregelmäßigere Interaktionen sowie durch deutlich weniger Emo- 
tionalität geprägt, z.B. zu einem flüchtigen Bekannten. Sie finden sich häufig in 
professionellen bzw. berufsbezogenen Netzwerken. 

Podolny und Baron (1997) zeigen in ihren Studien, dass auch dichte, homo- 
gene und nach außen geschlossene Netzwerke eine wichtige Grundlage für sozia- 
les Kapital sein können. Insbesondere für die Identitätsbildung, Sozialisation und 
Normeninternalisierung scheinen dichte Netzwerke die Grundlage für die Absiche- 
rung von Loyalitäten und den Aufbau von Legitimität zu sein. 

Diese Übersicht skizziert in sehr knapper Form die grundlegenden Ansätze 
sowie Befunde der sozialwissenschaftlichen Netzwerkforschung und dient der Ein- 
führung der bestehenden Netzwerktypen und Terminologien. Um den aktuellen 
Forschungsgegenstand der sozialwissenschaftlichen Netzwerkforschung zu ver- 
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deutlichen, können weiterführende Literaturhinweise hilfreich sein (Weyer 2011; 
Stegbauer/Häußling 2010; Scott/Carrington 2011). 


Soziales Kapital in Netzwerken 


Eingeführt wurde das Konzept des sozialen Kapitals von Hanifan (1916). Einzug 
erhielt es in den Sozial- und Bildungswissenschaften durch Coleman (1988) und 
den französischen Anthropologen und Soziologen Pierre Bourdieu (1986). Dabei 
wird das Konzept beschrieben als „die Gesamtheit der aktuellen und potenziellen 
Ressourcen, die mit der Teilhabe am Netz sozialer Beziehungen gegenseitigen Ken- 
nens und Anerkennens verbunden sein können. Es handelt sich dabei um Ressour- 
cen, die auf der Zugehörigkeit zu einer Gruppe beruhen“ (Bourdieu 1983: 190f.). 

Das Konzept des Sozialkapitals ist eng verbunden mit Bourdieus soziostruktu- 
rellen Analysen, die zeigen, dass bei unterschiedlichen gesellschaftlichen Schich- 
ten die Verfügbarkeit von Sozialkapital verschieden ausgeprägt ist. Insbesondere 
Unterschichten seien durch ihre geringe oder ungünstigere soziale Vernetzung 
systematisch in ihren Karrierechancen und beim Zugang zu Machtpositionen be- 
nachteiligt. 

Diese Verknüpfung zeigt, dass die Mitglieder von sozialen Netzwerken eher 
ähnliche Charakteristika aufweisen, und zwar nicht nur ähnliche sozioökonomi- 
sche Positionen, sondern auch ähnliche Wertvorstellungen und Verhaltensmuster, 
den sogenannten Habitus. Diese Homogenität führt aus Bourdieus Sicht zu einem 
Multiplikatoreneffekt sowie eingeschränkter Teilhabe und Zugangsmöglichkeiten. 
Insbesondere „Eliten“, so arbeitet Bourdieu an der modernen französischen Gesell- 
schaft heraus, institutionalisieren und reproduzieren sich auf diese Weise. 

Gestützt auf den Ansatz Granovetters (1985) entwickelte Coleman (1988) 
einen anderen Blickwinkel auf das soziale Kapital. Für Coleman sind vor allem die 
konkreten Beziehungen zwischen einzelnen agents von Interesse und die Über- 
legung, wie über eine Verstetigung und qualitative Umformung bloßer Kontakte 
zu einer gegenseitigen Vernetzung ein Mehrwert — ein besonderes soziales Kapi- 
tal - für alle Beteiligten entsteht. Hierbei wir der Begriff „embeddedness“ als eine 
besondere Beziehungsqualität zwischen mindestens zwei Personen, die durch ge- 
genseitiges Vertrauen, geteilte Erwartungen und Normen geprägt ist, eingeführt. 

Einen besonderen Fokus richtet Coleman in seiner Forschung auf das So- 
zialkapital von Familien und dessen Übertragung auf jüngere Generationen im 
Sozialisationsprozess. Soziales Kapital wird hier vor allem als familiäre Entwick- 
lungsressource verstanden und kann mit Youniss (1994) durch drei Charakteristika 
näher gekennzeichnet werden: durch die Intensität der Beziehung, die Strukturge- 
schlossenheit und die Zeitgeschlossenheit. 
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Erfassung und Beschreibung von sozialen Netzwerken 


Bei der Analyse von Netzwerkdatensätzen muss die spezifische Struktur der rela- 
tionalen Daten beachtet werden. Die Beobachtungen in relationalen Datensätzen 
stellen Beziehungen zwischen dem Unterstützungserbringer und Unterstützungs- 
nehmer dar. Somit liegen die Daten als eine Liste von Kanten oder Bögen vor. Das 
heißt, für ein Netzwerk von K-Beziehungen gibt es eine K x 2-Datenmatrix, in der 
jede Zeile eine Kante (wenn das Netzwerk nicht gerichtet ist) oder einen Bogen 
(wenn das Netzwerk gerichtet ist) zwischen zwei agents in den Zellen darstellt. 


Abbildung 2. Unterstützungserbringer und Unterstützungsnehmer als String- und nummerische 
Variablen (Datenauszug) 


Unterstützungserbringer Unterstützungsnehmer var3 var4 

a Mafred Ulrike 1 1 

2 Mafred Peter 1 14 

3 Laura 2 

4 Sandra Christof 3 4 

5 Sandra Laura 3 3 

6 Sandra Stefan 3 5 

7 Sandra Christof a 4 

8 Anna Susanne 4 5 

9 Anna Jamina 4 6 
10 Anna Christof 4 4 
11 Tina Susanne 5 5 
12 Tina Jose 5 6 
13 Michael Thomas 6 7 
14 Michael Sandra 6 8 
15 Klaus Stefan 7 5 
16 Klaus Christof 7 4 
17 Klaus Helmut 7 9 
18 Dominic Jörg 8 10 
19 Dominic Herbert 8 11 
20 Anne Herbert 9 11 
21 Anne Günter 9 13 
22 Anne Ulrike 9 1 
23 Sonja Peter 10 14 
24 Sonja Susanne 10 5 


Quelle: eigene Darstellung 


Weiterhin ist die Verwendung fehlender Werte erlaubt, um isolierte Beobachtungs- 
punkte zu illustrieren. In Abbildung 3 ist agents 2 isoliert. Die Hauptaufgabe bei der 
Netzwerkvisualisierung besteht darin, die Positionen der Netzwerkagents und die 
dazugehörigen Beziehungen in einem (typischerweise zweidimensionalen) grafi- 
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schen Layout zu bestimmen. Je nach Forschungsfrage ist es wünschenswert, dieje- 
nigen agents (Knoten), die eine zentrale Position im sozialen Netzwerk einnehmen, 
zu lokalisieren. agents, die keine zentrale Position einnehmen, werden mit größeren 
Abständen dargestellt. Um die Koordinaten für die Positionen der Netzwerkagents 
zu berechnen, kann die Multidimensionale Skalierung (MDS), die standardmäßig 
in Stata® vorhanden ist, herangezogen werden. Erstmalig wurde die MDS zur Netz- 
werkvisualisierung von Laumann und Guttman (1996) verwendet. 

Mit MDS-Verfahren können die Variablen durch Punkte in einem mehrdimen- 
sionalen Raum dargestellt werden. Hierbei werden die Distanzen zwischen zwei 
Punkten durch Nähe-, Abstands-, Ähnlichkeits- oder Unähnlichkeitswerte (ge- 
nannt Proximität) wiedergegeben. Das MDS-Modell definiert die Transformier- 
barkeit der Proximitäten (z.B. ordinal oder linear), und für die Distanzfunktion 
zwischen den Punkten wird meistens die euklidische Distanz herangezogen. Mit- 
hilfe des Stresswertes wird die formale Güte des MDS-Verfahrens dargestellt. Mit 
diesem Verfahren können Daten für explorative Zwecke visualisiert werden. 

Im Folgenden wird nun für die Daten aus Abbildung 2 durch Berechnung der 
Distanzen das dazugehörige soziale Netzwerk visualisiert (vgl. Abbildung 3). Zu- 
nächst werden die agents in zufälliger Reihenfolge auf einem Kreis angeordnet 
(vgl. Abbildung 4). Anschließend werden die Abstände mithilfe der MDS berech- 
net. Der hierzu verwendete Datensatz enthält Informationen über die Beziehun- 
gen zwischen zehn Unterstützungserbringern und 14 Unterstützungsnehmern, die 
mithilfe von Namensgeneratoren erfragt wurden. 


Abbildung 3: Netzwerkplot 


Quelle: eigene Darstellung 
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Die Daten sind in den ersten beiden Spalten als Strings formatiert, in den Variablen 
3 und 4 als nummerische Werte (vgl. Abbildung 2). Die Abbildung 3 wird mithilfe 
des Befehls netplot in Stata® (vgl. Anhang Do-file) erzeugt. Bei vielen Analysen 
ist es hilfreich, bestimmte Eckpunkte im Netzwerk identifizieren zu können. Die 
Identifizierung wird erleichtert, indem dem Diagramm mithilfe der Label-Option 
die Knotenbezeichnungen hinzugefügt werden. Aus der Abbildung wird ersicht- 
lich, dass dieses Netzwerk einen zusammenhängenden Kern aufweist (vgl. Knoten 
4,5,6,7). 


Abbildung 4: Netzwerkplot mithilfe der Kreis-Darstellung 


Quelle: eigene Darstellung 


Bei der Interpretation von Netzwerkvisualisierungen sollte beachtet werden, dass, 
wenn mithilfe von netplot diese Netzwerkrelationen erzeugt werden, bei Vorhan- 
densein vieler Scheitelpunkte mit dem gleichen Abstand die Positionierung im 
Kreis schwieriger wird. Um die Strukturen im Datensatz darzustellen, wird man 
zunächst fragen, inwieweit agents gleiche Verbindungen zu „denselben“ Personen 
haben. Demnach würden z.B. zwei agents „strukturell“ als umso ähnlicher einge- 
stuft und dementsprechend gleichen oder ähnlichen Positionen zugeordnet, je grö- 
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ßer z.B. der Anteil gemeinsamer Unterstützungsgeber an der Zahl der gesamten 
Unterstützungsgeber ist, die beide agents insgesamt haben. Es ist offensichtlich, 
dass ein solches Konzept zur Ermittlung von Positionen nur auf Beziehungen von 
agents in derselben Population von Kontaktpersonen anwendbar ist. 


Die Erfassung und Darstellung egozentrierter Netzwerke 


Egozentrierte oder persönliche Netzwerke umfassen die direkten Beziehungen 
einer bestimmten Art, die eine Person zu anderen Personen hat, und die Beziehun- 
gen zwischen diesen anderen Personen. Grundsätzlich besteht die Zielsetzung bei 
Erhebungen, Aussagen über eine Grundgesamtheit auf der Basis einer Stichprobe 
zu erlangen. Zufallsstichproben werden dabei nach dem Prinzip gezogen, dass die 
ausgewählten Einheiten voneinander unabhängige Repräsentanten der Grundge- 
samtheit sind. Beziehungen zwischen den ausgewählten Einheiten werden nicht 
berücksichtigt. Ähnlichkeiten aufgrund einer zu großen lokalen Klumpung der 
Personen beeinträchtigen die Schätzgenauigkeit von Parametern der Grundge- 
samtheit. 

Ein egozentriertes persönliches Netzwerk liegt nur dann vor, wenn der Be- 
fragte nach dem vorgegebenen Wahlkriterium andere Personen nennt und wenn 
er außerdem möglichst noch Auskunft über die Beziehungen der genannten Per- 
sonen untereinander gibt. Die Frage, die das Wahlkriterium festlegt, wird von Burt 
(1983: 296) „name generator“ genannt. Stehen die Namen als Antworten auf diese 
Frage fest, kann der Befragte um Auskunft über interessierende Merkmale der Al- 
teri wie Alter, Geschlecht, Rolle und Wohnort usw. gebeten werden („name inter- 
preter items“). 

Netzwerkfragen fokussieren auf die Art der Beziehung; die als Antwort auf 
den Namensgenerator genannten Personen können dann mit weiteren Fragen 
bestimmten Kategorien zugeordnet werden. So kann der Stellenwert bestimmter 
kategorialer Kontakte im Netzwerk ermittelt werden. Wie groß ist z.B. der Prozent- 
satz der Netzwerkunterstützer aus dem gleichen Wohnort oder der familiären oder 
professionellen Unterstützungsnetzwerke? 

In Abbildung 5 und 6 ist die Rollenzugehörigkeit der Alteri für Maßnahmen- 
teilnehmer (Ego) abgebildet, die mehr oder weniger starke oder auch keine Bezie- 
hungen zu dem Ego aufweisen. 
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Abbildung 5: Das Ego-Netzwerk, Fall Nr. 1, Zeitpunkt Oktober 2019 


Relation (dası 
ot (dasning) 


Relation colon) 
Posi — 


Quelle: eigene Darstellung 


Abbildung 6: Das Ego-Netzwerk, Fall Nr. 1, Zeitpunkt Oktober 2020 


Relation (dası 
oli (dasning) 


Relation (colon) 


Positiv — 


Quelle: eigene Darstellung 
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Abbildung 7: Das Ego-Netzwerk, Fall Nr. 2, Zeitpunkt Oktober 2019 


Relation (dashing) 


Relation (col 
ii 


po: 


Quelle: eigene Darstellung 


Abbildung 8: Das Ego-Netzwerk, Fall Nr. 2, Zeitpunkt Oktober 2020 


i wa (dashing) 


Relation color) 


positiv—— 


Quelle: eigene Darstellung 
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Auf der Grundlage von auf Netzwerkkarten gestützten Interviews, die sowohl in 
der Erstbefragung als auch in den zweiten Erhebungen im Rahmen der persönli- 
chen Netzwerkanalysen durchgeführt wurden, zeigt sich in den Falldarstellungen, 
wie sich die Netzwerkstruktur der Adressat:innen verändert hat. Die Netzwerk- 
größe und Kontakthäufigkeit haben sich durch die Kontaktbeschränkungen von 
Oktober 2019 bis Oktober 2010 deutlich verschlechtert, es kam zu einer erhöhten 
Hinwendung zum engen Familienkreis. 

Die Strukturmerkmale des Netzwerkes sind in Tabelle 2 dargestellt. Im Mittel 
wurden von den Befragten sechs Alteri genannt, das größte Netzwerk setzt sich aus 
zehn Alteri zusammen. Der EI-Index zur Messung der Ego-Alter-Heterogenität, der 
hier die Ähnlichkeit zwischen Ego-Erwerbsstatus aufzeigt, hat im Durchschnitt ei- 
nen Wert von 0,54. Der EI-Index entspricht dem Wert -1, wenn alle Alteri ebenfalls 
erwerbslos sind, und dem Wert +1, wenn der Erwerbsstatus aller Alteri verschie- 
den vom Ego-Erwerbsstatus ist. In unserem Fall liegen die Werte zwischen 0 und 1, 
was bedeutet, dass die Hälfte der fünf wichtigsten Alteri ebenfalls erwerbslos ist. 
Somit besteht im untersuchten Datensatz eine leichte Tendenz zu Homogenität der 
sozialen Netzwerke. 


Tabelle 2: Strukturmerkmale sozialer Netzwerke (N=31) 


Median Durch- Standard- min. max. Bezugs- 
schnitt abwei- größe 
chung 
Größe 6 6,62 2,78 2 10 alle Alteri 
El-Index 0,53 0,54 0,31 0 1 5 wichtigste 
Alteri 


Quelle: eigene Darstellung 


Persönliche Netzwerke und Nachbarschaftsstrukturen, einschließlich der Geschich- 
te der Region, Arbeitsmöglichkeiten, lokale Ressourcen und Beteiligungsmöglich- 
keiten, spielen eine sehr gewichtige Rolle beim Aufbau von Vertrauensbeziehungen. 
Aber auch Normen der Zusammenarbeit und Gegenseitigkeit, Muster der gegen- 
seitigen Hilfe und Informationsaustausch sowie Wahrnehmungen von Sicherheit 
können die Entstehung von sozialem Kapital befördern. Eine Förderung von hete- 
rogenen Netzwerkstrukturen kann als notwendige Dimension angesehen werden, 
um soziale Teilhabe nachhaltig in den Stadtteilen mit besonderem Handlungsbe- 
darf zu implementieren. 

In diesem Beitrag wird die Verwendung von multidimensionalen Skalierungs- 
methoden zur Visualisierung sozialer Netzwerke beschrieben. Die Methode kann 
mit dem Befehl netplot in Stata® aufgerufen werden. Anhand eines Beispiels aus 
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dem Bereich der Sozialen Arbeit werden Grenzen des Ansatzes diskutiert. Auf der 
Grundlage von auf Netzwerkkarten gestützten Interviews, die im Rahmen der 
persönlichen Netzwerkanalysen durchgeführt wurden, wird in diesem Beitrag die 
Netzwerkstruktur der Adressaten an zwei Erhebungszeitpunkten betrachtet. 
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Anhang: Stata®-Do-file - Netzwerkplots 


fnetplotdo x| Untitled.do x 


netplot Unterstiitzungserbringer Unterstiitzungsnehmer 
graph rename nooptions 


netplot Unterstützungserbringer Unterstützungsnehmer, type (mds) 
graph rename mds 


netplot Unterstützungserbringer Unterstützungsnehmer, type (circle) 
graph rename circle 


netplot Unterstützungserbringer Unterstützungsnehmer, type(circle) label 
graph rename circlelabel 


netplot Unterstiitzungserbringer Unterstützungsnehmer, type (circle) arrow 
graph rename circlearrow 


netplot Unterstützungserbringer Unterstützungsnehmer, iterations (4) 
graph rename iterations 


WKOUDKHARWNHYEOWODIUDHTRWNK 


graph combine nooptions mds circle circlelabel circlearrow iterations 


1 graph export netplot_test0l.pdf 


=: netplot var3 var4, label arrow 
!6 graph rename nooptions 


18 netplot var3 var4, type(mds) label arrow 
19 graph rename mds 


H netplot var3 var4, type (circle) 
32 graph rename circl 


34 netplot var3 var4, type (circle) label 
35 graph rename circlelabe 


37 netplot var3 var4, type(circle) arrow 
$8 graph rename circlearro 


10 netplot var3 var4, iterations (4) 
1 graph rename iteration 


13 graph combine nooptions mds circl circlelabe circlearro iteration 


I5 graph export netplot_test07.pdf 
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Soziale Medien im Internet basieren häufig auf graphentheoretischen Prinzipien, 
wodurch die gemeinläufige Bezeichnung als soziale Netzwerke tatsächlich auf 
Ausschnitte von sozialen Netzwerken verweist. Hierdurch lassen sich einige soziale 
Medien als Graphen und Netzwerke beschreiben. In der Regel lassen sich verschie- 
dene Ansätze der Netzwerkanalyse auf soziale Medien anwenden, konkret: 


1) Netzwerkanalyse mit Fokus auf Ausschnitte in den Medien 
2) Egozentrierte Netzwerke 
3) Netzwerktextanalyse 


Gemein haben alle drei Ansätze, dass sie eine mathematische Beschreibung von 
empirischen Phänomenen im Internet erlauben. Die sozialen Medien stellen eine 
Quelle zur Datengewinnung dar, die entweder manuell oder in manchen Fällen 
automatisiert verwendet werden kann. Ausschnitte beziehen sich in diesem Kon- 
text auf Interaktionen in ausgewählten Personengruppen, Interaktionen rund um 
ausgewählte Themen oder aber auch zeitbehaftete Beobachtungen. Die Netzwerk- 
textanalyse stellt ein Paradigma dar, welches eine inhaltliche Analyse von seman- 
tischen Texten in sozialen Medien mithilfe maschineller Verfahren erlaubt. Beiden 
Egonetzwerken werden Beziehungen zwischen einem Ego und dessen Alteri be- 
schrieben. Klassische Beispiele sind hier Freund:innen auf Facebook® oder Follo- 
wer:innen auf Twitter®. 

Ein großer Vorteil der graphenbasierten Plattformen der sozialen Medien liegt 
in der Möglichkeit, auf einfache Art große Datenmengen zu erheben. Einige Platt- 
formen wie Facebook® oder Instagram® haben diesen Vorteil für sich entdeckt und 
stellen zunehmend eigene Auswertungen mit kommerziellen Absichten zur Ver- 
fügung. Ein Nachteil ist also die Einschränkung des Zugangs für wissenschaftliche 
Zwecke. Weitere Probleme sind ethische Fragen, die mit der Analyse einhergehen. 
Viele Nutzer:innen sozialer Netzwerke sind sich über den Umfang der Analysemög- 
lichkeiten bewusst. 
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Folgender Beitrag wurde im Rahmen eines Seminars im Wintersemester 
2021/2022 praktisch an der Universität Duisburg-Essen im Kontext einer Reihe in 
den Bildungswissenschaften durchgeführt. Am Beispiel des Hashtags #bildunga- 
bersicher, bei dem zum Zeitpunkt des Seminars auf Twitter® über gesundheitliche 
Unversehrtheit im Schulunterricht während der weltweiten Covid-19-Pandemie 
diskutiert wurde, wird das Potenzial der Netzwerkanalyse im Sinne von Möglich- 
keiten und Grenzen dargestellt. Dabei ist die Analyse sehr punktuell, wobei Netz- 
werkanalysen im Internet immer nur einen Ausschnitt der Wirklichkeit aus einem 
bestimmten Blickwinkel darstellen. 

Im Folgenden wird zunächst in einem kleinen Exkurs die Geschichte der Netz- 
werkanalyse mit Bezug auf die Bildungswissenschaften dargestellt, und es werden 
die für den vorliegenden Artikel relevanten Konzepte vorgestellt. Hierbei wird ein 
allgemeines methodologische Grundverständnis vorausgesetzt. Nach dem Exkurs 
wird das untersuchte Phänomen, also die Diskussion rund um das Hashtag #bil- 
dungabersicher, kurz angerissen. Danach werden mit Blick auf den praxisorien- 
tierten Ansatz die Datenerhebung, -bereinigung und -analyse des Datensatzes 
beschrieben, bevor der Beitrag mit einem Ausblick und Fazit schließt. 


Exkurs Methode 


Die soziale Netzwerkanalyse (Wasserman/Faust 1994) ist eine Sammlung aus ver- 
schiedenen Ansätzen und Methoden zur Erhebung, Darstellung und Analyse von 
Netzwerkbeziehungen und reicht als Forschungsparadigma bis in den Anfängen 
des letzten Jahrhunderts zurück. 

Vielfach bekannt geworden ist die Netzwerkanalyse durch die Soziometrie 
Morenos in den 1930er-Jahren, der als Psychologe mittels der Soziometrie die Be- 
ziehung zwischen Menschen innerhalb von Gruppen beschrieb. 
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Abbildung 1: Soziogramm 


Quelle: eigene Darstellung 


Das Bild zeigt ein Soziogramm, das mit dem Graph Editor yEd® (https://www. 
yworks.com/products/yed) erstellt wurde. Angelehnt an Moreno stellen die Kno- 
ten A, B, C, D, E und F Personen in einer Gruppe dar. Die Kanten drücken die Be- 
ziehungen zwischen den Personen aus. Interessanterweise enthält das frühe Werk 
Morenos einige empirische Beispiele aus den sogenannten „Classroom Studies“, 
die insbesondere im frühen Verlauf der für die Netzwerkanalyse beeinflussenden 
Gruppenforschung bedeutsam sind (Freeman 2004). 

Im späteren Verlauf hat sich unter dem Einfluss der Ethnologie die Soziome- 
trie zu einer eigenen methodologischen Ausrichtung innerhalb der Sozialwissen- 
schaften entwickelt. Einen gut zugänglichen, deutschsprachigen Überblick über 
die Netzwerkanalyse liefern Schnegg und Lang (2001), insbesondere weil sie 
sowohl auf klassische Erhebungstechniken wie Papiergeneratoren als auch ego- 
netzzentrierte Netzwerke eingehen, bei denen Ego das Zentrum und die Alteri die 
Peripherie des Netzwerks darstellen (ebd.). Gerade diese Art von Beziehungen ist 
prägend für Freundschaftsnetzwerke in sozialen Netzwerken wie Facebook® mit 
dem User als Ego und der Alteri in der Freundesliste oder auch Twitter® mit den 
Follower:innen rund um den Nutzer:innenaccount. 

Geht man von einem Zugang zu einem Netzwerk über eine Person aus, so lässt 
sich das Netzwerk in einem Schneeballverfahren über die Alteri der Alteri erwei- 
tern. Allerdings ist die Möglichkeit einerseits durch technische Grenzen bedingt 
eingeschränkt, andererseits bedarf die Variabilität in der Festlegung der Grenzen 
eines Netzwerks einer theoretisch-methodologisch fundierten Begründung. Auch 
müssen hier Gütekriterien definiert werden, die eine Einordnung der Daten ein- 
schließlich der unzugänglichen Ausschnitte erlauben. 
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Mit zunehmenden Möglichkeiten der Berechnung von Netzwerken mittels 
Computer hat die Netzwerkanalyse jüngst international einen Schub erhalten. Hier 
finden sich neben Vertreter:innen der Sozialwissenschaften und der Mathematik 
auch Vertreter:innen der Informatik, der Physik und Biologie, die sich als Teil einer 
Network Science Community verstehen (Baräbasi/Pösfai 2016). Auf inhaltlicher 
Ebene sind neben der Betrachtung von Netzwerken über Zeit insbesondere Metho- 
den des Graph-Clustering im Fokus der jüngeren Forschung, die einen erheblichen 
Anteil an den jüngsten Fortschritten in der Netzwerkanalyse haben. Diese gehen 
mit den großen Datenmengen einher, die durch die sozialen Netzwerke im Internet 
verfügbar sind, wenngleich bis auf Reddit zum jetzigen Zeitpunkt alle Plattformen 
Einschränkungen für externe Forschung implementiert haben. 

Für den vorliegenden Beitrag wird neben der Degree-Zentralität, die sich ver- 
einfacht durch die Anzahl der ein- und ausgehenden Kanten definiert, ein einfa- 
cher Ansatz des Clustering k-Core (Wasserman/Faust 1994) angewandt, welches 
konkret auf kohäsive Subgruppen ausgerichtet Akteur:innen mit einer Anzahl von 
mindestens k Beziehungen untereinander als Clique identifiziert. 

Zudem werden Affiliationsnetzwerke extrahiert und betrachtet, die die Ein- 
beziehung einer weiteren semantischen Ebene in die Analyse erlauben. Diese 
Netzwerke sind bimodale Netzwerke, die neben dem Typ Akteur:in einen weiteren 
Typ von Knoten beinhalten. Damit können beispielsweise Beziehungen zwischen 
Menschen ausgedrückt werden, die an den gleichen Veranstaltungen teilgenom- 
men haben oder sich über bestimmte Themen unterhalten. Folgende Abbildung 
zeigt beispielhaft ein bimodales Netzwerk, welches in der Netzwerkanalyse auch 
als 2-Mode-Netzwerk bezeichnet wird. 


Abbildung 2: 2-Mode-Soziogramm, visualisiert mit yEd® 


Quelle: eigene Darstellung 
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Das einfache Bild stellt ein hypothetisches Interessennetzwerk dar. Während sich 
Anke für das Thema Bildung und Peter für das Thema Gesundheit interessiert, 
beteiligt sich Maria an beiden Themen. Sowohl die beschriebene, einfache De- 
gree-Zentralität als auch das Clusteringverfahren k-Core lassen sich auf 2-Mode- 
Netzwerke anwenden. 


Gegenstand der Untersuchung 


Zum Zeitpunkt des Seminars war, wie eingangs erwähnt, das Hashtag #bildun- 
gabersicher zunächst wegen des thematischen Bezugs zum Bildungssektor sowie 
aufgrund seiner Aktualität ausgewählt worden. „Bildung Aber Sicher“ bezeichnet 
sich als Graswurzel-Initiative, mit dem Ziel, das Recht auf Bildung mit dem Schutz 
der Kinder und ihren Angehörigen zu vereinen. Zum Zeitpunkt der Erhebung am 
15.11.2022 waren offene Briefe an Entscheidende gerichtet worden, um das ideo- 
logische Ziel der Initiative zu bekräftigen. 

Aus der Sicht der Forschung sollte zunächst klargestellt werden, dass davon 
auszugehen ist, dass eine solche Initiative sicherlich ideologische Ziele verfolgt, 
von denen sich Wissenschaft nicht instrumentalisieren lassen sollte. Somit ist die 
Auswahl aus der wahrscheinlich gegebenen Varianz mit dem Polarisierungspoten- 
zial des Themas zu begründen. Diese verspricht somit einen breiten Einblick in ein 
temporäres Phänomen. Damit einhergehend ist das Interesse, die Chancen und 
Grenzen der ausgewählten Methode an einem praktischen Beispiel zu demonstrie- 
ren. Die Ergebnisse der kleinen Untersuchung können und sollten unter dieser Prä- 
misse bewertet und nicht losgelöst von diesen Bedingungen in anderen Kontexten 
eingebunden werden. 

Im weiteren Verlauf der Analyse wurde im Nachgang im Juni 2022 eine wei- 
tere Erhebung des Hashtags #bildungabersicher mit einem Verfahren der 2-Mo- 
de-Datenextraktion durchgeführt, um die semantische Ebene der verwandten 
Themen zu analysieren, die als weitere Hashtags von den Akteur:innen im Netz- 
werk im Kontext des Hashtags #bildungabersicher getwittert werden. 


Datenerhebung und Bereinigung 


Die Daten wurden am 15.11.2022 mit dem Tool NodeXL® (Smith et al. 2009) in 
der aktuellen Pro Version erhoben. NodeXL® ist ursprünglich im Auftrag von Mi- 
crosoft® Research als Plugin für das Office-Programm Excel® entwickelt worden. 
Es kann mittels Zugriffs auf Anwendungsschnittstellen Daten aus den Plattformen 
Twitter®, Flikr®, Youtube® und Mediawiki® extrahieren und in Netzwerkdaten 
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überführen. In der hier vorliegenden Untersuchung wurde, wie im Screenshot 
dargestellt, das Hashtag #bildungabersicher in einer einfachen Abfrage auf 2.000 
Tweets reduziert abgefragt. Das Netzwerk definiert sich aus Accounts, die den 
Tweets mit dem Hahstag gepostet, retweetet, ihn erwähnt oder auf einen solchen 
Tweet geantwortet haben. Eine Beziehung zwischen den Accounts entsteht damit 
durch eine Reply (Antwort) oder Mention (Erwähnung) eines Tweets oder Re- 
tweets, das das Hashtag #bildungabersicher enthält. 

Das resultierende Netzwerk wurde in das Format des Auswertungstools Pajek® 
(Batagelj/Mrvar 2004) exportiert und beinhaltet 1.408 Knoten. Der Datensatz wur- 
de nicht bereinigt, da NodeXL® in der Regel Zeichenencoding von Nutzeraccounts 
korrekt entschlüsselt, sodass keine Dopplungen entstehen. Andere Werkzeuge sind 
in der Hinsicht oftmals weniger fehlertolerant, sodass je nach Programm zur Da- 
tenerhebung eine Datenbereinigung notwendig ist. 


Abbildung 3: Screenshot von NodeXL® in Excel®, mit Erlaubnis von Microsoft® und der Social 
Media Research Foundation 


In Daten Überprüfen Ansicht Hilfe NodeXL Pro 


who was replied to or mentioned in recent tweets 
his option 


work plus tends (very slow!) 


Limitto 2000 5) tweets 
O Ihave a Twitter account, but have not yet authorized NodeXL 
fo use my account to import Twitter networks. Take ma to 
Twitter's authorization Web page. 
n n owen 
© I havo a Twittar account, and | have authorized NodeXl. to use ee 
my account to import Twitler networks 


Für die methodische Einordnung der Datenqualität muss erwähnt werden, dass 
Twitter® grundsätzlich die Abfragen an die Schnittstelle reduziert. Das hier ver- 
wendete Tool NodeXL® umgeht das Problem mit zwei Ansätzen. Einerseits wird 
der Zugang zur Twitter®-Schnittstelle mit einem vorhandenen Benutzer:innen- 
account verifiziert, weil Twitter® damit einen größeren Zugriff erlaubt. Anderer- 
seits pausiert NodeXL® während der Abfragelimits und setzt die Abfrage nach dem 
zeitlichen Limit fort. Dies kann dazu führen, dass eine Abfrage mehrere Tage dau- 
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ert. Daher wurde im vorliegenden Fall nur eine Menge von 2.000 Tweets abgefragt. 
Generell muss bei der Planung von Forschungen mit Daten aus Social-Media-Platt- 
formen einkalkuliert werden, dass die Betreiber:innen jederzeit den Zugriff auf die 
Daten einschränken können. Eine solche Einschränkung hat beispielsweise Face- 
book® in der Vergangenheit durchgeführt. In der Regel wird ein solcher Schritt mit 
einer längeren Vorlaufzeit und Ankündigung vollzogen. 

Da NodeXL® nur unimodale Netzwerke erheben kann und semantische In- 
formationen damit nur implizit in den Personenbeziehungen repräsentiert wer- 
den, wurde im Nachgang mit einem Werkzeug namens Tweet Archivist® (https:// 
de.tweetarchivist.com/) eine Erhebung des Hashtags #bildungabersicher im Juni 
2022 durchgeführt. Tweet Archivist® hat gegenüber NodeXL® den Vorteil, dass 
eine kontinuierliche Datenerhebung möglich ist. Hierzu kann ein Abonnement des 
Dienstes verwendet werden. Für die vorliegende Analyse wurde die Desktopversion 
von Tweet Archivist® verwendet und die Erhebung auf einen Zeitpunkt beschränkt. 
Tweet Archivist® exportiert die Sammlung an Tweets in einem tabulatorseparier- 
ten Textformat, das mit einfachen Mitteln in andere Formate transformiert werden 
kann. Im vorliegenden Fall wurden die Daten mit einem einfachen Skript in eine 
kommaseparierte Liste verwandelt. Das Skript wurde von Lothar Krempel für die 
gemeinsam durchgeführten Seminare in der Programmiersprache AWK (http:// 
www.gnu.org/software/gawk/gawk.html) geschrieben und wird mit seiner Er- 
laubnis durch den Autor des Beitrags weiterverwendet. Es extrahiert eine Liste, die 
dem Formatmuster „@Twitternutzer, #Hashtag“ entspricht. Dies kann dann mit 
dem Werkzeug txt2Pajek (http://www.pfeffer.at/txt2pajek/) von Jürgen Pfeffer in 
ein 2-Mode-Datensatz für Pajek® transformiert werden. 


Abbildung 4: Screenshot von txt2pajek (Verwendung mit Erlaubnis des Autors) 


[E txt2Pajek 3: Create Pajek Files File - a 
Run Info Exit 
Basic Advanced 


Input Flete) | [D:\Documents Publikationen \Hofacker22\2mode\hash1 tet 


(Output File(s) [D:\Documents Publikationen Hofacker22\2mode\20220625Bildungabersichecnet 


Separator: |eamt >| Other view: @Hermyfor _ #schattenfamilien 


1st column: 2nd column: Line values: Network type: Header lines: 
‘@Hermyitor 7] | #schattenfamilien |i ~= | 2-mode undirected (#Edges) Fo 


‘Input file(s) selected: D:\Doruments\Publikationen\Hafacker22\2mode\hash1 tt 
‘Output file(s) selected: D;\Documents\Publikationen\Hofacker22\2mode\hashl.net 
Creating network :D:\Documents\Publikationen|\Hofacker22\2mode\202206258ildungabersichernet 
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Hierbei gilt zu beachten, dass als Trenner Komma ausgewählt werden muss und 
Loops und leere Zellen in den Einstellungen von txt2pajek erlaubt werden müssen. 


Ethische Aspekte des Datenschutzes 


Ergänzend zum Beitrag „Datenschutz in der empirischen (Sozial-)Forschung“ von 
Vanessa Lettieri im 5. Kapitel dieses Sammelbandes, muss bei der Erhebung von 
Daten aus Social-Media-Quellen auf zusätzliche, ethische Aspekte bezüglich des 
Datenschutzes hingewiesen werden. Da es sich zunächst um eine beobachtende 
Methode handelt, gelten hier auch die gegebenen Verhaltensweisen zum Schutze 
des Persönlichkeitsrechtes der im Netzwerk enthaltenen Personen. Auch wenn die 
Nutzer:innen von Twitter® durch die fehlende Klarnamenpflicht die Möglichkeit 
zur Auswahl eines Fantasienamens (Nickname) haben, so nutzen viele Menschen 
den Dienst mit Angabe ihres Realnamens. 

Diese Entscheidung obliegt dem Selbstbestimmungsrecht der jeweils be- 
troffenen Person. Jedoch ist für viele Nutzer:innen nicht offensichtlich, welche 
Möglichkeiten der Datenerhebung bestehen. Es wird zwar in den allgemeinen 
Geschäftsbedingungen auf die Verwendung der Daten für Marketingzwecke hin- 
gewiesen, strenggenommen hat aber die betroffene Nutzerin oder der betroffene 
Nutzer nicht der diesem Beitrag zugrunde liegenden Untersuchung zugestimmt. 
Der vorliegende Beitrag beschränkt sich daher auf die Verwendung des Twitter®- 
Nutzernamens, der durch das @-Zeichen gekennzeichnet ist, und nicht auf die An- 
gabe des Realnamens, sofern dieser bei Twitter® angegeben ist. Generell empfiehlt 
der Autor, für vergleichbare Untersuchungen die erhobenen Daten zu sichten und 
im Falle sehr eindeutiger Ausprägungsmerkmale eine zusätzliche Anonymisierung 
vorzunehmen. 


Analyse 


Betrachtet wird der Datensatz in der Anwendung Pajek®. Auch wenn NodeXL® 
grundsätzlich die semantischen Informationen in den Tweets beinhaltet, werden 
diese nicht als Teil der Netzwerkgraphen behandelt. Somit fehlen die Inhalte der 
Tweets bei einem Export in das Pajek®-Datenformat. Damit sind in diesem Beitrag 
nur die Akteur:innen des Twitter®-Netzwerks Gegenstand der Analyse. Ein erster 
Blick in den Datensatz verdeutlicht die Dichte des Netzwerks, obwohl die Abfrage 
auf 2000 Tweets reduziert war. 

Nachfolgendes Bild zeigt das geladene und visualisierte Netzwerk in Pajek®. 
Obwohl das Visualisierungsfenster von Pajek® über eine Zoomfunktion verfügt, so 
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ist es praktisch unmöglich, die wichtigsten Elemente zu erkennen. Zwar lässt sich 
das Netzwerk in der Darstellung durch Anordnungsalgorithmen mit Spring-Em- 
bedder-basierten Kräftemodellen der Abstand zwischen den Knoten optimieren, 
jedoch ist das Netzwerk immer noch zu dicht für eine übersichtliche Darstellung. 


Abbildung 5: Netzwerk visualisiert in Pajek® (Verwendung mit Erlaubnis von Andrej Mrvar) 


Ba Pajek64 5.14 = o x 
File Network Networks Operations Partition Partitions Vector Vectors Permutation Permutations Cluster Hierarchy Options Draw Macro 
Info Tools 
Networks £ 
Ba 1. DADocuments\Privat\Lehreneu\WS2122\DatenseminarHofacker\Bildungabersicher.net (1408) - a X 


Layout GraphOnly Default Previous Redraw Next Options Export Spin Move Info FishEye Wait 


© stepbeie Onworiczek 


Daher werden wir im Folgenden durch den weiter oben aufgeführten Ansatz der 
Clusterings von kohäsiven Subgruppen k-Core versuchen, den Kern des Netzwerks 
als Partition zu extrahieren und zu visualisieren. 

Hierzu muss zunächst auf der Ebene des Netzwerks eine Partition mit dem 
k-Core-Algorithmus für ungerichtete Netzwerke (Network -> Create Partition -> 
k-core -> all bezogen auf Pajek® in der Version 5.14) erzeugt werden. In unserem 
Fall beinhaltet die extrahierte Partition 8 Cores bzw. Kerne. 

Visualisiert man nur die zwei innersten Kerne des Netzwerks durch die Reduk- 
tion auf die dichtesten Partitionen 7 und 8, wird ein Netzwerk mit 102 Akteur:in- 
nen sichtbar. 
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Abbildung 6: Export des One-Mode-Netzwerks aus Pajek® 


Um eine etwas deutlichere Kontrastierung zu erhalten, wurden die normierten 
Zentralitätswerte zur Bestimmung der Größe der Knoten verwendet und Autori- 
täten mit einer hohen Zentralität grün gefärbt. 

Hier wird deutlich, dass sich einerseits föderale Strukturen im Netzwerk wi- 
derspiegeln, da sich einige bundeslandspezifische Accounts im Kern des Netzwerks 
befinden. Zudem sind politisch zentrale Accounts wie diejenigen von Olaf Scholz, 
Jens Spahn und des Robert Koch-Instituts nah am Kern des Netzwerks positioniert. 
Im Vergleich zum Ursprungsnetz sind die Knoten in der Peripherie des Kerns als 
Hubs interpretierbar, die den Pfad zum Kern ebnen. An dieser Stelle wird deut- 
lich, dass auch klassische Medien wie die Taz®, die Morgenpost®, die FAZ® und 
der Tagesspiegel® eine wichtige mediierende Rolle zum Zeitpunkt der Debatte auf 
Twitter® spielen. 

Die nachgelagerte Two-Mode-Datenanalyse mit Pajek® ergibt zunächst ein 
dichtes Netzwerk, bestehend aus 499 Knoten, von denen 384 Personen bzw. Twit- 
ter®-Accounts in dem Netzwerk und die restlichen Knoten Hashtags sind. Visua- 
lisiert man das Netzwerk in Pajek®, so wird durch die Dichte kaum eine sinnvolle 
visuelle Analyse möglich. 
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Abbildung 7: Unreduziertes Two-Mode-Netzwerk aus Pajek® 
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Es wird lediglich deutlich, dass ein dichter und zusammenhängender Kern den 
Großteil des Netzwerks ausmacht. Hierdurch ergibt sich, dass eine Reduktion des 
Netzwerks durch eine Two-Mode-k-Core-Analyse den tatsächlichen Kern des Netz- 
werks extrahieren wird. 

Um das richtige Verhältnis zwischen den unterschiedlichen Knotentypen Per- 
son und Hashtag zu ermitteln, wird zunächst in Pajek® ein Report aller Cluster 
ab einer Dichte von mindestens zwei Grad pro Knotentyp mittels des Befehls Net- 
work->2-Mode-Network->Core->2-Mode Review erzeugt. 


Kl K2 #Rows #Cols #Comp 
2 2 159 69 1 
2 3 156 56 1 
2 4 150 43 1 
2 5 145 37 1 
8 6 21 24 1 
8 7 21 21 i 
8 8 20 13 1 
8 9 17 11 1 
8 10 11 5 i 


Tabelle 1: Core Review des Two-Mode-Netzwerks #bildungabersicher (Ausschnitt) 
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In der Tabelle 1 sehen wir, dass eine Reduktion aufein Core von jeweils 8 Grad Min- 
destdichte pro Knotentyp ein Netzwerkkern, bestehend aus 20 Knoten des Perso- 
nentyps und 13 des Hashtagtyps, mit einem Verhältnis von 0,6 gegenüber 0,76 von 
Personen gegenüber Gesamtknoten etwas mehr zugunsten der Hashtags clustert. 
Dies erscheint jedoch mit Blick auf Fragmentierungstendenzen in der Peripherie 
des Netzwerks plausibel, und somit wird anhand des Reviews für die Extraktion 
eines Subnetzes, basierend auf jeweils mindestens 8 Degreegrad pro Knotentyp, 
entschieden. 

Die Extraktion des Netzwerks führt zu einem Netzwerk der Größe 33 Knoten, 
von denen 20 Personen und 13 Hashtags sind. Das Clustering erfolgt in Pajek® 
mittels des Befehls Network -> 2-Mode Network -> Core -> 2 Mode. Dies erzeugt 
eine Partition, in der alle 33 Knoten aus dem 8,8 Core in der Kernpartition 1 und 
alle übrigen Knoten in der Peripherie Partition 0 landen. Extrahiert man nun ein 
Subnetzwerk aus der Partition 1 mit dem Befehl Operations -> Network + Parti- 
tion > Extract Subnetwork induced by Union of Selected Clusters und wählt hier 
die Cluster 1-*, so wird ein neues Netzwerk mit 33 Knoten erzeugt. Wir berechnen 
nun eine 2-Mode Partition, um die Knotentypen mittels der Partition hinsichtlich 
der Visualisierung farblich unterscheiden zu können, und berechnen einen Vektor 
mit der Degree-Zentralität, dessen Grad wir bei der Visualisierung für die Größe 
der Knoten verwenden. Das visualisierte Ergebnis findet sich in Abbildung 8. 


Abbildung 8: Reduziertes Two-Mode-Core-Netzwerk, exportiert aus Pajek® 
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Die grünen Knoten sind in diesem Affiliationsnetzwerk die Hashtags. Die gelben 
Knoten sind in diesem Affiliationsnetzwerk die Personen. Der wichtigste Knoten 
ist unser Ausgangsknoten #bildungabersicher. Da mittlerweile seit der ersten Ana- 
lyse einige Monate vergangen sind, sehen wir in dem Netzwerk, dass aktuell eine 
rege Diskussion in Baden-Württemberg um das Thema entstanden ist. Wir sehen 
zudem Hashtags zu den Themen #longcovid, #schattenfamilien, #maskenpflicht 
und #impfmichu5. Auch sehen wir ein dadurch entstandenes Fragment, indem 
ein Typo bei #schattenfamilien zu einer Doppelung des Knotens geführt hat. Dies 
lässt sich zwar im Ursprungsdatensatz korrigieren, wird aber keinen signifikanten 
Effekt auf das Ergebnis haben, sodass hier zugunsten der Authentizität der „Beob- 
achtung“ auf eine Korrektur verzichtet werden kann. 

Um den Einfluss der Korrektur zu demonstrieren, wurde die Korrektur in der 
Quelldatei mittels Suchen und Ersetzen durchgeführt. Eine Korrektur ist auch in- 
nerhalb von Pajek® möglich, jedoch aufwendig. Das Ergebnis zeigt bei einem Core 
Review der Mindestdegreegrade von jeweils 8 pro Knotentyp ein Ergebnis von ei- 
nem Netzwerk aus 32 Knoten, wovon 20 Nutzerknoten und 12 Hashtags sind. Dass 
nun statt 13 Hashtagknoten 12 vorhanden sind, liegt daran, dass sowohl #schat- 
tenfamilen mit Tippfehler als auch der korrekt geschriebene Hashtag #schatten- 
familien nun im Knoten #schattenfamilien enthalten sind. Das Ergebnis ist in 
Abbildung 9 dargestellt. 


Abbildung 9: Reduziertes und bereinigtes Kern-Netzwerk, exportiert aus Pajek® 
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Fazit 


Der Beitrag hatte das Ziel, das Potenzial der sozialen Netzwerkanalyse mit Blick 
auf eine Debatte zum Thema Bildung während der Pandemie aufzuzeigen. Das uni- 
modale Netzwerk beinhaltet jedoch keine semantischen Informationen über das 
Geschehen. 

An dieser Stelle sind zwei Vertiefungsmöglichkeiten gegeben und sinnvoll, da 
die Kern-Peripherie-Struktur bereits eine interessante Anordnung von Twitter®-Ac- 
counts rund um das Thema aufzeigt. 

Der erste Weg ist eine qualitative Analyse der Inhalte der Knoten im Kern und 
erweiterten Zentrum zum Zeitpunkt der Debatte. Dies ist jedoch aufwendig, da 
hier politisch prominente Accounts und klassische Medien mit einem breiten Spek- 
trum an Themen zu analysieren sind. 

Der zweite Weg ist eine bimodale Analyse der Daten, die benachbarte Hash- 
tags rund um #bildungabersicher in den Fokus nimmt. Auf der Ebene der Analyse 
ist dies mit passenden Werkzeugen keine besondere Herausforderung. Pajek® ist 
beispielsweise eines der wenigen Anwendungen der sozialen Netzwerkanalyse, die 
grundsätzlich auf die Analyse von bimodalen Netzwerken spezialisiert sind. Auch 
der gezeigte, einfache, aber effektive Clustering-Ansatz mittels k-Core ist für bi- 
modale Netzwerke verfügbar, sodass neben den Kernaccounts auch die zentralen 
Hashtags identifiziert werden können. 

Die Herausforderung beim zweiten Ansatz besteht in der Erhebung, Aufbe- 
reitung und Bereinigung der Daten. Der Autor verfügt über selbst programmierte 
Tools, die kontinuierlich archivierte Tweets in Netzwerkdaten verwandeln können, 
die weiterverarbeitet und bereinigt eine weitere Analyse mit Pajek® ermöglichen. 

Der vorliegende Artikel hat zumindest einen ersten Einblick in die bimodale 
Analyse mit einem Toolchain aus verfügbaren Tools und Diensten sowie einfachen 
selbstprogrammierten Skripten gegeben und dokumentiert. Der Königsweg wird 
jedoch eine kontinuierliche Analyse in Kombination mit qualitativen Inhaltsana- 
lysen sein. Ziel des vorliegenden Beitrages war es zu verdeutlichen, dass solche 
Analysen möglich und sinnvoll sind, betrachtet man die Ergebnisse. Die Ergebnis- 
se können zeigen, dass eine aktuelle Debatte wie die um das Hashtag #bildunga- 
bersicher entstandene eine systematische Beobachtung mittels Netzwerkanalysen 
erlaubt, die einen Einstieg in weiterführende, qualitative Analysen darstellen kön- 
nen. 
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4 Herausforderungen bei der 
Rekrutierung und Erhebung 
spezifischer Zielgruppen 


4.1 Herausforderungen in der empirischen 
Sozialforschung mit disziplinspezifischen 
Zielgruppen (,,hard-to-survey populations“) 


Anne Bohlender, Jana Brix, Jessica Gröber, Thorsten Heien & Dirk Hofacker 


Im vorangegangenen Themenblock 3 dieses Sammelbandes - „Etablierte und in- 
novative Datenquellen“ — wurde die breite Palette von Sekundardaten skizziert, die 
der quantitativen Sozialforschung zur Verfügung stehen. Diese reichte dabei von 
prozessproduzierten öffentlichen Verwaltungsdaten (vgl. Kap. 3.1), über klassi- 
sche bevölkerungsrepräsentative Befragungsdaten (vgl. Kap. 3.2) bis hin zu Netz- 
werkdaten aus sozialen Medien (vgl. Kap. 3.3 und 3.4). Der Rückgriff auf derartige 
Sekundärdaten bietet sich an, wenn diese in ausreichendem Maße die für die eige- 
ne Forschungsfrage interessierenden Inhalte bzw. Indikatoren beinhalten sowie 
den jeweiligen Qualitätsanforderungen genügen. 

Ist dies nicht der Fall, so ist meist eine eigene Erhebung von Daten unumgäng- 
lich. In der quantitativen Methodenliteratur finden sich umfangreiche Empfehlun- 
gen für die anzuwendenden Vorgehensweisen bei einer eigenen Erhebung, sowohl 
für die Stichprobenziehung als auch die Rekrutierung potenzieller Untersuchungs- 
teilnehmer:innen und die Datenerhebung - d.h. die konkrete Sammlung von unter- 
suchungsrelevanten Informationen. Vielfach orientieren sich diese Empfehlungen 
an bestimmten „Standardannahmen“ über die zu untersuchende Population bzw. 
die Durchführung der Datenerhebung. 

Zu den Spezifika der Forschung in den bildungswissenschaftlichen Studien- 
gängen (Erziehungswissenschaft, Soziale Arbeit und dem bildungswissenschaftli- 
chen Anteil im Lehramt) zählt jedoch, dass hier mitunter besondere Zielgruppen im 
Mittelpunkt stehen (vgl. Nohl 2019), die spezielle Anforderungen an Rekrutierung 
und Erhebung stellen. So werden in der bildungs- oder erziehungswissenschaft- 
lichen Forschung häufiger Schüler:innen befragt, die zum Befragungszeitpunkt 
noch nicht volljährig sind und unter Umständen je nach Alter oder Entwicklungs- 
stand in unterschiedlichem Maße in der Lage sind, sich verbal oder schriftlich zu 
artikulieren. Forschung in der Sozialen Arbeit nimmt hingegen oftmals benachtei- 
ligte gesellschaftliche Randgruppen in den Blick, die zum einen einen vergleichs- 
weise geringen Bevölkerungsanteil ausmachen, zum anderen - etwa mangels eines 
festen Aufenthaltsorts — nicht ohne Weiteres zugänglich sind. 
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Solche für die quantitative Forschung in bildungswissenschaftlichen Diszipli- 
nen charakteristische Herausforderungen in Rekrutierung und Erhebung stehen 
im Mittelpunkt dieses Kapitels. Zu Beginn werden dazu die Begriffe der Rekrutie- 
rung und der Datenerhebung nochmals auf allgemeiner Ebene erläutert und ein 
eher kursorischer Überblick über „standardisierte“ Vorgehensweisen in beiden 
Bereichen gegeben. Anschließend werden auf theoretischer Ebene mögliche He- 
rausforderungen hinsichtlich Rekrutierung und Erhebung skizziert sowie erste 
theoretische Lösungsansätze vorgestellt. Wir orientieren uns dabei systematisch an 
der einschlägigen Unterscheidung von schwer zu befragenden Zielgruppen (,,hard- 
to-survey-populations“) nach Tourangeau (2014)!. Drei Beispiele aus der konkreten 
Umfragepraxis illustrieren anschließend diese Herausforderungen, konturieren 
aber auch gleichzeitig mögliche und bewährte Lösungsansätze. 


Identifikation und Rekrutierung 


Die Identifikation und Rekrutierung von Studienteilnehmer:innen stellt häufig 
den ersten Schritt der Feldphase eigener Forschungsprojekte dar. Der Begriff der 
Rekrutierung beschreibt dabei die „Kontaktierung und Anwerbung von Untersu- 
chungspersonen entsprechend der vorangegangenen Stichprobenkonstruktion“ 
(Döring/Bortz 2016: 296). Dementsprechend müssen sowohl die Forschungsfra- 
ge als auch die daraus hervorgehende Zielgruppe im Voraus bestmöglich definiert 
werden. Sollen im Rahmen quantitativer Erhebungen Aussagen über eine definier- 
te Grundgesamtheit getroffen werden, so muss bei der konkreten Auswahl der Fälle 
auf die Repräsentativität geachtet werden. Insbesondere im Kontext groß angeleg- 
ter quantitativer Studien ist der theoretische Idealfall einer Vollerhebung, d.h. der 
Befragung aller Personen der angestrebten Zielgruppe, praktisch meist unrealis- 
tisch. Darum gibt es verschiedene forschungsmethodische Strategien zur Ziehung 
einer vom Umfang her begrenzten Stichprobe, die im Idealfall die untersuchungs- 
relevanten Merkmale und Merkmalsträger:innen der Grundgesamtheit widerspie- 
gelt und somit für diese — unter Berücksichtigung des mit der begrenzten Auswahl 
einhergehenden Stichprobenfehlers — stellvertretend untersucht werden kann.? 
Spiegeln die Personen der Stichprobe die untersuchungsrelevanten Merkmale der 
Grundgesamtheit unverzerrt wider und stellen damit quasi ein „Miniaturbild der 


1 Eine ähnliche Klassifikation findet sich auch bei Marpsat/Razafindratsima (2010). 

2 Idealerweise beruht eine solche Stichprobe auf einem konkret bestimm- und abgrenz- 
baren Auswahlrahmen, der alle Elemente der Grundgesamtheit enthält und etwa für 
Zufallsstichproben als Basis verwendet werden kann. Bei bevölkerungsrepräsentativen 
Stichproben könnte dies etwa eine Melderegisterdatei öffentlicher Ämter sein, bei tele- 
fonischen Stichproben eine Liste aller bekannten Telefonanschlüsse. 
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Grundgesamtheit“ dar, wird diese als repräsentativ angesehen (vgl. Döring/Bortz 
2016: 298). Die sogenannten Auswahlverfahren zur Konstruktion einer solchen 
Stichprobe lassen sich dabei in Zufallsauswahlen (engl. „random-“ oder „probabi- 
listic sample“), bewusste Auswahlen (engl. „judgement-“ oder „purposive sample“) 
sowie willkürliche Auswahlen (engl. „convenience sample“) unterscheiden (vgl. 
Schnell/Hill/Esser 2008: 271). Zufallsauswahlen sind in diesem Zusammenhang 
die einzigen Verfahren zur Ziehung einer Stichprobe, die im Rahmen berechenba- 
rer statistischer Fehlertoleranzen repräsentative und damit verlässliche Aussagen 
über die Grundgesamtheit ermöglichen. Wie die Bezeichnungen der anderen bei- 
den Auswahlverfahren bereits verraten, handelt es sich bei der bewussten Auswahl 
um im Voraus bewusst festgelegte Kriterien zur Ziehung einer Stichprobe (etwa zu 
erfüllende Quoten spezifischer Charakteristika der befragten Personen), während 
es sich bei der willkürlichen Auswahl um ein weitgehend unsystematisches Vor- 
gehen handelt und darum besonders starke Verzerrungen mit dieser einhergehen 
(vgl. Döring/Bortz 2016: 302; Hofäcker/Stegl 2021: 61ff.). Auf den ersten Blick 
sind die bewusste Auswahl und die willkürliche Auswahl somit für aussagekräf- 
tige quantitative Studien ungeeignet. Bei bestimmten, schwer zu erreichenden 
Zielgruppen, die aufgrund unklarer Zugangswege oder fehlender Basisdaten nicht 
ohne Weiteres mit Zufallsverfahren zu rekrutieren sind, stellen sie jedoch mitunter 
eine pragmatische Alternative für die Identifikation und Rekrutierung dar, wobei 
jedoch die Konsequenzen für die Aussagekraft der eigenen Studie (ggf. keine Re- 
präsentativität) berücksichtigt werden müssen. 

In Verbindung mit der Entscheidung für ein bestimmtes Auswahlverfahren 
steht der Weg der konkreten Kontaktaufnahme. Diese ist beispielsweise persönlich, 
postalisch, telefonisch, per E-Mail oder über soziale Medien direkt oder auch über 
Dritte möglich. 

Bei der Identifikation und Rekrutierung von Zielpersonen müssen somit 
1. das Auswahlverfahren sowie 2. der Weg der Kontaktaufnahme zum einen an 
die Forschungsfrage und zum anderen auf die angestrebte Zielgruppe und ggf. die 
Forschungsfrage bestmöglich abgestimmt werden. Dies bietet gleichzeitig einen 
Spielraum zur Reaktion auf Herausforderungen in der Rekrutierung spezifischer 
Zielgruppen, auf die im entsprechenden Abschnitt näher eingegangen wird. 


Erhebung 


War die Rekrutierung von Studienteilnehmer:innen erfolgreich, so kann im nächs- 
ten Schritt die Erhebung der Daten beginnen. Unter dem Begriff der Erhebung 
versteht man dabei das systematische Sammeln von relevanten Informationen 
zur Beantwortung der eigenen Forschungsfrage (vgl. Döring/Bortz 2016: 322). 
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Hier sind aus quantitativer Sicht insbesondere die Befragung, die Beobachtung, die 
Inhaltsanalyse sowie das Experiment zu nennen, welche allesamt etablierte Metho- 
den darstellen (vgl. Hofäcker/Stegl 2021: 90ff.; Döring/Bortz 2016: 323ff.; Häder 
2019: 298ff.). Innerhalb dieser Erhebungsverfahren sind ebenfalls verschiedene 
Umsetzungsweisen möglich. So kann die Befragung beispielsweise schriftlich oder 
computergestützt stattfinden, weiterhin lassen sich diese in persönlich-mündlich, tele- 
fonisch oder online durchgeführte Befragungen unterscheiden (vgl. Hofäcker/Stegl 
2021: 79ff.; Häder 2019: 200ff.). Auf diese Subkategorien der Erhebungsmethoden 
soll hier nicht weiter im Detail eingegangen werden; entsprechend wird auf die ein- 
schlägige quantitative Methodenliteratur verwiesen, die diese ausführlich beschreibt 
(s.o.). Im Rahmen dieses Beitrags konzentrieren wir uns stattdessen auf spezifische, 
in den bildungswissenschaftlichen Disziplinen häufig anzutreffende Zielgruppen, 
bei denen sich besondere Herausforderungen in Rekrutierung und Erhebung erge- 
ben können. Für diese beispielhaften Zielgruppen skizzieren wir unter Rückgriff auf 
die Umfragepraxis Lösungsansätze zum Umgang mit Herausforderungen durch ent- 
sprechend angepasste Erhebungs- und Rekrutierungsstrategien. 


Herausforderungen in Rekrutierung und Erhebung 


Einige dieser Herausforderungen sollen im Folgenden exemplarisch skizziert wer- 
den. In der Darstellung findet dabei eine Orientierung an der von Tourangeau 
(2014) aufgestellten Unterscheidung verschiedener forschungspraktischer Heraus- 
forderungen statt: den allgemeinen Schwierigkeiten bei der Stichprobenziehung 
(„hard-to-sample populations“, Tourangeau 2014: 3ff.) und der Identifizierung der 
Zielpersonen („hard-to-identify-populations“; ebd.: 6ff.), der Erreichbarkeit der 
Zielgruppe („hard-to-reach-populations“; ebd.: 10ff.), deren Teilnahmebereitschaft 
und -motivation („hard-to-persuade-populations“; ebd.: 12ff.) sowie spezifischen 
Herausforderungen bei der Durchführung eines Interviews („hard-to-interview-po- 
pulations“; ebd.: 14f.). Diese Systematik liegt auch der anschließenden Darstellung 
von Fallbeispielen aus der Forschungspraxis zugrunde. 


Herausforderungen bei der Stichprobenziehung (hard-to-sample populations) und 
der Zielgruppenidentifikation (hard-to-identify populations) 


Eine besondere und vor allem für die Soziale Arbeit typische Herausforderung stellen 
Zielgruppen mit einer niedrigen Bevölkerungsinzidenz dar; also Personengruppen, 
die in der Gesamtbevölkerung nur (sehr) selten vorkommen. Hierzu können etwa 
spezifische soziale Minderheiten zählen. Mittels einer Zufallsauswahl aus einem 
Stichprobenrahmen, der die gesamte Bevölkerung abdeckt (z.B. Melderegister der 
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Gemeinden), können solche Gruppen nur mit einem hohen zeitlichen und monetä- 
ren Aufwand erfasst werden, da zur Realisierung einer ausreichenden Stichproben- 
größe eine sehr große Menge an Screening-Interviews durchgeführt werden muss. 
Größere Markt- und Meinungsforschungsinstitute können derartige Erhebungen im 
Rahmen umfangreicher, regelmäßig durchgeführter Mehrthemenumfragen („Om- 
nibus-Surveys“) gegebenenfalls noch vergleichsweise kosteneffizient durchführen. 
Für einzelne Forschende oder kleinere Projektkontexte stellt dieses Vorgehen jedoch 
meist keine gangbare Möglichkeit dar. Eine Alternative zur Rekrutierung derartiger 
„hard-to-survey populations“ besteht in der Rekrutierung von Studienteilnehmer:in- 
nen an spezifischen Orten, an denen die betreffende Zielgruppe überdurchschnitt- 
lich häufig anzutreffen ist. Ein denkbares Beispiel wäre die Rekrutierung von 
Bezieher:innen spezifischer sozialer Dienstleistungen an deren Erbringungsort 
(etwa durch die Befragung obdachloser Menschen an zentralen Essenausgaben oder 
Schlafstätten). Bedacht werden muss hier, dass derartige Rekrutierungsstrategien 
möglicherweise zuungunsten der Repräsentativität gehen können. So lassen sich ob- 
dachlose Menschen zwar über Essensausgaben effizient(er) rekrutieren, gleichwohl 
stellen Nutzer:innen von Essensausgaben unter Umständen nur einen spezifischen 
Teil der Zielbevölkerung dar; obdachlose Personen, die derartige Angebote nicht 
nutzen oder stärker durch ihr soziales Umfeld unterstützt werden, werden hier kaum 
erreicht (vgl. Beierle/Hoch 2021: 319). Derartige Einschränkungen der Repräsen- 
tativität sollten bei der Datenauswertung und -interpretation berücksichtigt und bei 
der Berichterstattung transparent kommuniziert werden. 

Eine weitere Herausforderung für die Rekrutierung ergibt sich bei Zielgrup- 
pen, die zwar vergleichsweise häufig in der Bevölkerung vertreten sind, aber nur 
bedingt als Zielpersonen zu identifizieren sind (hard-to-identify populations). 
Tourangeau (2014: 6f.) verweist hier etwa auf die Angehörigen ethnisch, sexuell 
oder religiös stigmatisierter Personen, die sich aufgrund dieser Stigmata nicht als 
solche zu erkennen geben möchten oder können. Ein möglicher Zugang könnte 
hier bei guter Vernetzung der Zielpersonen untereinander durch ein Schneeballver- 
fahren geschaffen werden, in dem zunächst einige initiale Zielpersonen rekrutiert 
und diese anschließend nach weiteren Kontakten in ihrem Umfeld gefragt werden. 
Auch hier wäre jedoch die Repräsentativität der Stichprobe aufgrund möglicher 
Verzerrungen bei der Auswahl der Erstkontakte nicht gewährleistet; methodische 
Weiterentwicklungen des Schneeballverfahrens wie das „Respondent Driven Sam- 
pling“, die eine höhere Repräsentativität versprechen, sind meist sehr aufwendig 
und in kleineren Forschungskontexten nur schwer zu realisieren? (vgl. Döring/ 
Bortz 2016: 308ff.). 


3 Zur aktuellen Entwicklung dieser Methode siehe beispielsweise Sosenko/Bramley (2022) 
(für fortgeschrittene Leser:innen). 
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Herausforderungen bei der Erreichbarkeit (hard-to-reach populations) 


Ein häufiges Problem in der Rekrutierung von Studienteilnehmer:innen ist deren 
Erreichbarkeit. Damit kann zum einen der räumliche Zugang gemeint sein: Die- 
ser kann durch einen fehlenden festen Wohnsitz erschwert sein (vgl. Hauprich, in 
diesem Band), zum anderen können auch wechselnde Wohnsitze (wie beispiels- 
weise durch Zweitwohnsitze oder Studienortwechsel bei Studierenden, vgl. Tou- 
rangeau 2014: 10) oder geschlossene Wohnsitze (wie bei „gated communities“; 
vgl. Litz 2000) die Erreichbarkeit beschränken. Liegen diese Herausforderungen 
vor, so ist die Rekrutierung über Adressdaten oder den (festen) Wohnsitz meist 
nicht praktikabel oder realisierbar. Eine alternative Möglichkeit bestünde in der 
Kontaktaufnahme mittels technischer Unterstützung, etwa über soziale Medien 
oder E-Mail-Adressen. Insbesondere bei Studierenden ist hierbei von großen Er- 
folgen auszugehen (vgl. Trübner/Schmies 2019: 967). Bei anderen Zielgruppen 
wiederum kann das Problem auftreten, dass die hierfür notwendige technische 
Ausstattung — beispielsweise ein Handy mit Internetzugang — oder die benötigten 
Kompetenzen zur Bedienung dessen nur bedingt vorhanden sind. Dies könnte man 
beispielsweise in Bezug auf obdachlose Menschen oder die Gruppe älterer Perso- 
nen (vgl. Motel-Klingebiel et al. 2019: 938) vermuten. Zu letzteren forschte Kai 
Hauprich (2021) im Rahmen seiner Dissertation „Die Mobiltelefon- und Internet- 
nutzung durch Menschen mit Lebensmittelpunkt Straße in Nordrhein-Westfalen und 
ihr Nutzen in deren besonderen Lebensverhältnissen“, der im dritten Beitrag (Kap. 
4.3) dieses Themenblocks intensiver auf seine Erfahrungen in der Forschung mit 
obdachlosen Menschen eingeht. Im Falle solcher Zielgruppen, die schwieriger 
erreichbar und gesellschaftlich wenig sichtbar sind, kann sich — allerdings mög- 
licherweise einhergehend mit einer eingeschränkten Repräsentativität — eine Rek- 
rutierung gemäß des oben beschriebenen Schneeballprinzips oder aber auch über 
Multiplikator:innen anbieten. So können gegebenenfalls auch Hilfseinrichtungen 
bei der Rekrutierung um Unterstützung gebeten werden (vgl. Beispiel 3 in diesem 
Kapitel). 


Herausforderungen bei der Teilnahmebereitschaft und -motivation 
(hard-to-persuade populations) 


Eine weitere Herausforderung in der quantitativen Sozialforschung ist die Moti- 
vation der Zielpersonen zur Teilnahme an einer wissenschaftlichen Studie. Zur 
Steigerung der Teilnahmebereitschaft werden häufig (monetäre) Anreize — soge- 
nannte Incentives — eingesetzt, die als finanzielle „Belohnungen“ bzw. als kleines 
„Dankeschön“ die Teilnahmemotivation erhöhen sollen (vgl. Berger 2006; Häder 
2019: 260; Schnell 2019: 172f.). Dieses Vorgehen kann auf der einen Seite bei 
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richtiger Herangehensweise die Teilnahmequote an der Studie erhöhen; auf der 
anderen Seite ist die Nutzung von Incentives aus forschungsethischer wie metho- 
discher Sicht zu reflektieren. Zum einen sollen die Personen freiwillig und ohne 
äußeren Zwang in eine Studie einwilligen. Zum anderen ist eine gewisse intrinsi- 
sche Motivation bei der Teilnahme an Studien erwünscht, um zu vermeiden, dass 
Personen beispielsweise nur Muster ankreuzen oder die Studie nicht gewissenhaft 
durchführen, um schnell an das eigentliche Ziel - die Incentives — zu gelangen. Der 
Einsatz dieser sollte daher immer abgewogen werden, und im Falle der Entschei- 
dung für Incentives sollten diese verhältnismäßig und bedacht gewählt werden. 

Unabhängig von der Verwendung von Incentives ist es in jedem Fall empfeh- 
lenswert, durch ein Ankündigungsschreiben umfassend über die Studie und die 
Bedeutung einer Teilnahme daran aufzuklären und hierdurch einen möglichen 
Mehrwert der Studienergebnisse für die Teilnehmenden selbst zu betonen (vgl. 
Faulbaum 2019: 544; Reuband 2019: 776); so beispielsweise bei Evaluationsfor- 
schungen, die zur Verbesserung eines Angebots o.Ä. durchgeführt werden. Auch 
das generelle Erläutern der gesellschaftlichen Relevanz der Studie kann helfen. Um 
Einrichtungen von einer Unterstützung zu überzeugen, empfiehlt es sich außer- 
dem, eine Präsentation der anonymisierten Studienergebnisse nach Vollendung 
dieser anzubieten. Dies kann ebenso in Form eines Verweises darauf, wo die Stu- 
dienergebnisse im Anschluss zu finden sind, auch den Zielpersonen selbst angebo- 
ten werden. 


Herausforderungen in der Interviewdurchführung (hard-to-interview populations) 


Spezifische Herausforderungen sind mitunter auch in der Durchführung von In- 
terviews in sozial- und bildungswissenschaftlichen Kontexten zu bewältigen. Von 
besonderer Bedeutung sind hierbei sprachliche Barrieren sowie rechtliche Beson- 
derheiten bei der Befragung Minderjähriger. 

Sprachliche Barrieren treten vor allem in der Forschung mit Migrant:innen be- 
ziehungsweise Fremdsprachler:innen (vgl. El-Menouar 2019), mit Kindern und 
Jugendlichen (vgl. Nachtsheim/König 2019) sowie bei Menschen mit Behinderun- 
gen (vgl. Kersting et al. 2019) auf. Hierbei ist sowohl in der Rekrutierung als auch 
in der Erhebung eine hohe Flexibilität, Vielfältigkeit und/oder Zielgruppenkennt- 
nis notwendig. Bei Kindern kann man sprachlichen Barrieren insbesondere durch 
die Verwendung Leichter Sprache entgegnen. Bei Menschen mit Behinderungen 
ist meist eine Anpassung der Rekrutierungs- und Erhebungsmethode notwendig. 
Falls sich die betroffenen Personen nicht verbal äußern können, sollte sowohl in 
der Rekrutierung als auch der Erhebung eine schriftliche Form bevorzugt, im Falle 
von Sehbehinderungen hingegen eine verbale Form verwendet werden. Im Falle 
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geistiger Einschränkungen kann ebenfalls die Verwendung Leichter Sprache oder 
von Smiley-Antwortskalen vorteilhaft sein. Bei der Forschung mit Migrant:innen 
beziehungsweise Fremdsprachler:innen kann — unter Anbetracht methodischer 
Konsequenzen (wie beispielsweise der Güte und Vergleichbarkeit von Erhebungs- 
instrumenten) und sofern aufwandstechnisch möglich — auch eine Übersetzung 
der Erhebungsinstrumente in Betracht gezogen werden. Generell gilt außerdem, 
dass der Rückgriff auf bereits etablierte und auf ihre Güte geprüfte Erhebungsins- 
trumente von großem Vorteil sein kann, wenn diese entsprechend zum eigenen 
Forschungsvorhaben und (den Herausforderungen mit) der Zielgruppe passen. 

In Befragungssituationen können schließlich auch Unsicherheiten, Scham 
und Ängste seitens der Befragten auftreten. Um diesen entgegenzuwirken, sollte 
frühzeitig eine entsprechende Aufklärung über die Studie stattfinden, die für die 
befragten Personen verständlich ist, entsprechend der informierten Einwilligung 
gemäß Art. 7 DSGVO. Auch die Erläuterung der Anonymität, des vertraulichen 
Umgangs mit den Daten, der Neutralität der Forschenden (beispielsweise von der 
Einrichtung, über die die Personen rekrutiert wurden) sowie der Einsatz von spe- 
ziell geschultem und erfahrenem Personal (im Falle groß angelegter Erhebungen) 
erleichtern den Umgang mit diesen Unsicherheiten der Befragten. Bei der Befra- 
gung von Kindern sollte ebenfalls eine Befragung im Beisein der Eltern oder ande- 
rer Vertrauenspersonen unter Berücksichtigung der methodischen Konsequenzen 
(wie der Beeinflussung des Antwortverhaltens) in Betracht gezogen werden. Bei 
der Befragung Erwachsener kann ein umgekehrter Effekt vorliegen, sodass der 
Ausschluss Dritter zum Abbau von Scham und sozialer Erwünschtheit empfehlens- 
wert ist. 

Bestimmte Zielgruppen unterliegen besonderen rechtlichen Rahmenbedingun- 
gen, die über die üblichen in den Kapiteln 1 und 5 beschriebenen hinausgehen. 
So ist im Falle der Forschung mit Minderjährigen oder nicht einwilligungsfähi- 
gen Personen die Einwilligung durch eine gesetzliche Vertretung notwendig. Die 
Beurteilung der Einwilligungsfähigkeit ist dabei für fachfremde Personen meist 
nicht einfach. Vier Vereinigungen, die in der sozialwissenschaftlichen Forschung 
federführend sind, haben darum eine „Richtlinie zur Befragung Minderjähriger“ 
entworfen, die die hier zu beachtenden Vorschriften, insbesondere zur Einwilli- 
gungsfähigkeit, übersichtlich zusammenfasst (vgl. ADM et al. 2021). Weiterhin 
sind insbesondere in der Forschung mit Schüler:innen die geltenden Schulgesetze 
und -verordnungen zu beachten, die im jeweiligen Landesrecht verankert sind. Für 
Nordrhein-Westfalen ist beispielsweise 8 120 Abs. 4 des SchulG (RdErl. d. Ministe- 
riums für Schule und Weiterbildung v. 15.07.1996 GABI. NW. I S. 1) zu beachten, 
welcher spezifische Regelungen zur Forschung in der Schule und mit Schüler:in- 
nen festschreibt. 
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Hinsichtlich bildungs- und sozialwissenschaftlicher Fragestellungen empfiehlt 
es sich, bereits bei der Konzeption von eigenen Befragungen mögliche Herausforde- 
rungen in Rekrutierung und Erhebung frühzeitig zu bedenken. Vielfach kann die- 
sen durch entsprechende Rekrutierungswege und Erhebungsstrategien rechtzeitig 
entgegengewirkt werden. Abhängig von Fragestellung und avisierter Zielgruppe 
müssen dann passende und realisierbare Rekrutierungs- und Erhebungsmethoden 
überlegt werden. 

Im Folgenden sollen anhand dreier ausgewählter Studienbeispiele des Markt- 
und Sozialforschungsunternehmens Kantar Public typische Herausforderungen 
in Rekrutierung und Erhebung veranschaulicht und mögliche pragmatische Lö- 
sungsstrategien skizziert werden. Wenngleich hier nicht jedes Vorgehen in iden- 
tischer Weise auch auf kleinere Forschungskontexte wie etwa Lehrforschungen 
übertragbar ist, finden sich dennoch eine Reihe von hilfreichen Anregungen für die 
eigene Forschungspraxis. Die Darstellungen orientieren sich dabei wiederum an 
den oben beschriebenen Kategorien forschungsmethodischer Herausforderungen 
von Tourangeau (2014). 


Studienbeispiele von Kantar Public 


Beispiel 1: 
FAMOD - Familienmodelle in Deutschland 2019/2020 


Im Zentrum des Projekts „Familienmodelle in Deutschland“ (FAMOD) stand die 
Vielfalt gelebter Familienformen in Deutschland. Das von der Deutschen For- 
schungsgemeinschaft (DFG) geförderte Projekt war ein interdisziplinäres For- 
schungsvorhaben, das die Perspektiven aus Soziologie und Rechtswissenschaften 
vereinte. 

Im Rahmen einer standardisierten Befragung wurden dabei Mitglieder aus 
1.554 Familien überwiegend persönlich-mündlich befragt (vgl. Steinbach et al. 
2020). Der Fokus lag dabei auf dem Wohlbefinden der einzelnen Familienmitglie- 
der. Um der Vielzahl unterschiedlicher Familienformen Rechnung zu tragen, wur- 
den Eltern und Kinder sowohl aus Kernfamilien als auch aus Trennungsfamilien 
(im Residenz- oder Wechselmodell) befragt. 


Hard-to-sample/hard-to-identify: Da die gelebte Familienform kein Merkmal ist, 
das sich in den Informationen der Einwohnermeldeämter findet, lag eine größere 
Herausforderung im Bereich der Grundlage zur Generierung der Stichprobe. Be- 
gegnet wurde dem in Form einer Quotenstichprobe — d.h., die Interviewenden 
meldeten an die verantwortliche Studienleitung Personen mit den entsprechenden 
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Merkmalen (Kernfamilie vs. Trennungsfamilie, Residenz- vs. Wechselmodell, Kin- 
der bis 7 Jahre vs. Kinder zwischen 7 und 14 Jahren, im Falle von Trennungsfami- 
lien: neuer Partner ja/nein), und es wurde versucht, diese Familien gemäß eines 
vorgegebenen Quotenplans zu befragen. 


Befragt werden sollte nicht nur ein Elternteil, sondern auch 


— ein Kind im Alter von 7-14 Jahren, 
— das andere Elternteil im Haushalt, 
— im Falle von Residenz-/Wechselmodell das extern lebende Elternteil. 


Hard-to-reach/hard-to-persuade: Im Zuge der Befragung stellte vor allem die 
Generierung von Adressen außerhalb des familiären Haushalts lebender Personen 
und deren Überzeugung ein größeres Problem dar, wobei hier auf den langjäh- 
rigen Erfahrungsschatz (bezüglich der Generierung weiterer Personen innerhalb 
und außerhalb des Haushalts der befragten Personen) der eingesetzten Interview- 
enden zurückgegriffen werden konnte. Zudem stand ein Papierfragebogen zur Ver- 
fügung, der auch ohne die Weitergabe der Kontaktdaten ausgefüllt werden konnte. 
Darüber hinaus wurde für die zusätzlichen Personen (andere Elternteile innerhalb 
und/oder außerhalb des Haushalts des Kindes) ein Incentive in Höhe von fünf Euro 
gezahlt. Den Interviewenden standen zur Überzeugung der Befragungspersonen 
ein Projektflyer und ein längeres Anschreiben als zusätzliches Informationsmate- 
rial zur Verfügung. 


Hard-to-interview: Bezüglich der Befragung selbst bestand die größte Herausfor- 
derung in der Gestaltung des Befragungsinstruments bzw. der Befragungssituation 
für die Kinder im Alter von 7-14 Jahren. Der kindliche Entwicklungsstand in die- 
ser Altersspanne ist recht unterschiedlich, sodass der Fragebogen viele altersange- 
passte Frageformulierungen und -stellungen enthielt; darüber hinaus wurde auch 
die Ansprache der Kinder (Du/Sie) altersgemäß angepasst. Hinzu kommt, dass die 
Kinder dazu in der Lage sein mussten, über das für sie ggf. schwierige Thema der 
elterlichen Trennung zu sprechen. Die Befragungsdauer sollte zudem nicht länger 
als 30 Minuten sein, die Interviewenden erfahren im Umgang mit minderjährigen 
Befragten sein, und es musste vor der Durchführung des Interviews sichergestellt 
sein, dass eine explizite Einwilligung des befragten Elternteils vorlag (vgl. ADM 
et al. 2021). Die zeitliche Abfolge der Befragung sah dabei vor, dass zunächst im- 
mer ein Elternteil befragt und im Rahmen dieser Befragung das Einverständnis zur 
Kinderbefragung eingeholt wurde, ebenso die Kontaktdaten ggf. extern lebender 
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Elternteile. Die Befragung der Kinder erfolgte nur, wenn ein Elternteil während der 
Befragung im Haushalt anwesend war. 

Neben Erkenntnissen über das Wohlbefinden von Kindern und deren Eltern 
in Trennungs- und Kernfamilien wurden auch Informationen über die tatsächliche 
Gestaltung des Umgangsrechts zwischen getrenntlebenden Eltern und ihren Kin- 
dern erhoben. 


Beispiel 2: 
IAB-BAMF-SOEP-Flüchtlingsbefragung 2016 


Mit der IAB-BAMF-SOEP-Flüchtlingsbefragung sollten die Zuströme von geflüch- 
teten Personen ab dem Jahr 2013 nach Deutschland mit einer neuen Längsschnitt- 
studie abgebildet werden. Auftraggeber des Projekts waren das Deutsche Institut 
für Wirtschaftsforschung (DIW Berlin) in Kooperation mit dem Institut für Arbeits- 
markt- und Berufsforschung (IAB) und dem Bundesamt für Migration und Flücht- 
linge (BAMF). In der ersten Welle 2016 wurden ca. 4.500 Personen in ca. 3.300 
Haushalten persönlich-mündlich befragt (vgl. Brücker et al. 2017). 

Da Geflüchtete in aller Regel gemeldet sind, war die Stichprobenziehung über 
die Ausländerzentralregister (AZR) umsetzbar. Die Herausforderung der Studie 
lag demnach weniger im Bereich Stichprobe („hard to sample“, „hard to identify“), 
sondern vor allem im Bereich der Kontaktierung („hard to find or contact“, „hard 
to persuade“) und Befragung („hard to interview“). 


Hard-to-reach: Zunächst war es nicht immer einfach, die Zielpersonen an der 
übermittelten Adresse aufzufinden, da die Zielgruppe speziell zu Beginn des Auf- 
enthalts in Deutschland häufig umzog. Deshalb wurden vermehrt Adressrecher- 
chen bei den Einwohnermeldeämtern getätigt und die Interviewenden versuchten, 
vor Ort neue Adressen zu erfragen. Des Weiteren stand der Zugang zu Gemein- 
schaftsunterkünften nicht jedem offen. Dort wurden besonders erfahrene und 
überzeugungsstarke Interviewer:innen eingesetzt, die über zusätzliches Material 
(Schreiben des BAMF sowie Pressemappe mit Artikeln zum Projekt) verfügten, um 
Mitarbeiter:innen der Unterkünfte von der Legitimität des Forschungsvorhabens 
zu überzeugen. 


Hard-to-persuade: Waren die Zielpersonen erfolgreich kontaktiert, erschwerten 
die Sprachkenntnisse in vielen Fällen die Überzeugungsarbeit. Um dieses Hin- 
dernis zu überwinden, konnten die Interviewer:innen auf Unterlagen (z.B. An- 
schreiben, Projektbroschüre) in vielen verschiedenen Sprachen zurückgreifen und 
ließen sich oftmals von Personen aus dem Umfeld der Geflüchteten unterstützen, 
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die Deutsch oder Englisch sprachen. Zusätzlich wurden eigens für das Projekt ara- 
bischsprachige Interviewer:innen rekrutiert. 


Hard-to-interview: Beim Interview selbst waren ebenfalls die fehlenden Deutsch- 
kenntnisse eine der größten zu überwindenden Hürden. So wurde ein für dieses 
Projekt eigens konzipierter zweisprachiger Fragebogen eingesetzt, in dem alle 
Fragen- und Antworttexte auch in den Fremdsprachen Englisch, Arabisch, Farsi, 
Paschtu und Urdu angezeigt wurden und als Audiodateien abspielbar waren. Zu- 
dem erleichterte der Einsatz arabischsprachiger Interviewer:innen auch an dieser 
Stelle die Befragung dieser „hard-to-survey population“. 


Beispiel 3: 


Empirische Untersuchung zu Wohnungslosen ohne Unterkunft und verdeckt 
Wohnungslosen im Rahmen der Wohnungslosenberichterstattung des 
Bundes 2022 


Im Auftrag des Bundesministeriums für Arbeit und Soziales und gemäß 8 8 Abs. 2 
und 3 Wohnungslosenberichterstattungsgesetz haben die Gesellschaft für innova- 
tive Sozialforschung und Sozialplanung e.V. (GISS; Bremen) und Kantar Public 
(München) vom 1.-7. Februar 2022 die erste bundesweit repräsentative empiri- 
sche Erhebung zu wohnungslosen Personen ohne Unterkunft und zu verdeckt woh- 
nungslosen Personen durchgeführt. Die beiden Gruppen wurden analog zu den 
Kategorien 1 (People living rough), 5 (People living in nonconventional dwellings 
due to lack of housing) und 6 (Homeless people living temporarily in conventional 
housing with family and friends due to lack of housing) der verkürzten „European 
Typology of Homelessness and housing exclusion“ (ETHOS Light; FEANTSA 2007) 
definiert (Brüchmann et al. 2022: 17): 


— Wohnungslose ohne Unterkunft: Personen, die in wenigstens einer der letzten 
sieben Nächte vor ihrer Befragung auf der Straße oder in Behelfsunterkünften 
übernachtet haben, etwa unter Brücken, in Hauseingängen, in Kellern, in Ab- 
bruchhäusern, Autowracks, Zelten oder Parks. 

— Verdeckt Wohnungslose: Personen, die in wenigstens einer der letzten sieben 
Nächte vor ihrer Befragung weder institutionell untergebracht waren noch zu 
den Straßenwohnungslosen zu zählen sind und die wegen der Notlage, nicht 
über eine eigene mietvertraglich oder durch Eigentum abgesicherte Wohnung 
zu verfügen, vorübergehend Zuflucht bei Bekannten oder Familienangehörigen 
gesucht haben, ohne dort ihren ständigen Wohnsitz zu haben. 
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Wohnungslose stellen selbst unter den „hard-to-survey populations“ eine besonde- 
re Gruppe dar, sodass im Grunde genommen alle Kriterien von Tourangeau (2014) 
auf ihre Befragung zutreffen. 


Hard-to-sample: Mangels zentralem Register wurden auf Basis einer dreistufi- 
gen Zufallsstichprobe von a) 151 Gemeinden b) 757 öffentlichen, verbandlichen 
oder privat-wohltätigen Institutionen der Wohnungslosenhilfe und angrenzender 
Hilfesysteme (z.B. Beratungsstellen, Streetwork, Essensausgabestellen, Tagesauf- 
enthalte, medizinische Versorgung, Sozialämter, Jobcenter) in diesen Gemeinden 
sowie c) Wohnungslosen in diesen Institutionen die Wohnungslosen (bzw. Kon- 
takte zu den Wohnungslosen) in der Erhebungswoche Anfang Februar 2022 ge- 
zählt und über 1.500 schriftliche und Online-Interviews mit Wohnungslosen ohne 
Unterkunft und verdeckt Wohnungslosen durchgeführt. Diese Interviews (bzw. 
Personen) konnten später auf Basis der Auswahl- und Ausfallwahrscheinlichkeiten 
auf die Grundgesamtheit gewichtet und hochgerechnet sowie repräsentativ aus- 
gewertet werden. 


Hard-to-reach: Die Stichprobenziehung und spätere Kontaktierung und Befra- 
gung über die Institutionen geschahen unter der Annahme, dass Wohnungslose zur 
materiellen Existenzsicherung entsprechende Hilfen benötigen und nur ein sehr 
geringer Anteil der Grundgesamtheit — vor allem in der Erhebungswoche im Win- 
ter — nicht in entsprechenden Institutionen vorstellig wird (vgl. auch Shaghaghi et 
al. 2011). 


Hard-to-identify: Die Zählung der Wohnungslosen durch die Mitarbeitenden in 
den Institutionen erfolgte mittels eines schriftlichen Protokolls mit ausführlichen 
Erläuterungen zur Identifikation und Erfassung sowie zur Auswahl und Einladung 
zum Interview einschließlich der Unterstützung der Zielpersonen bei der Befra- 


gung.* 


Hard-to-interview: Fiir die Befragung wurde ein zielgruppengerechter Kurz- 
fragebogen mit 16 einfachen inhaltlichen Fragen einschließlich Erläuterungen 
in Deutsch und fünf Fremdsprachen (Arabisch, Bulgarisch, Englisch, Polnisch, 
Rumänisch) eingesetzt. 


4 Zu weiteren methodischen Details einschließlich der Identifikation und Korrektur von 
Mehrfachzählungen und -teilnahmen von Wohnungslosen vgl. Brüchmann et al. (2022), 
Busch-Geertsema/Heien (2021). 
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Hard-to-persuade: Unterstützt wurden die Zählung und Befragung der Woh- 
nungslosen durch telefonische Ansprechpersonen bei der GISS und Kantar Public 
sowie eine Webseite mit weiteren Informationen. Teilnehmende Wohnungslose 
erhielten als kleines Dankeschön einen Einkaufsgutschein im Wert von vier Euro. 

Mit der Studie liegen nun erstmals belastbare Zahlen darüber vor, wie viele 
Menschen in Deutschland ohne Unterkunft auf der Straße oder in behelfsmäßigen 
Provisorien übernachten und wie viele Menschen in verdeckter Wohnungslosigkeit 
bei Bekannten oder Angehörigen unterkommen (vgl. Brüchmann et al. 2022). Da- 
rüber hinaus werden Informationen zur soziodemografischen Zusammensetzung 
beider Gruppen von Wohnungslosen und zu wichtigen Aspekten ihrer Lebenslage 
bereitgestellt - z.B. zum Verlust der Wohnung, zu gesundheitlichen Beeinträch- 
tigungen und Gewalterfahrungen sowie zur Nutzung von Einrichtungen der Not- 
unterbringung. 
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4.2 Empirische Forschung mit Menschen 
mit psychischen Störungen - 
Herausforderungen in Rekrutierung und 
Datenerhebung 


Thomas Forkmann 


1 Einführung 


Ungefähr jeder dritte Erwachsene in Deutschland leidet innerhalb eines beliebigen 
Jahres mindestens einmal unter einer psychischen Störung (vgl. Jacobi etal. 2014). 
Dabei ist das gleichzeitige, d.h. komorbide, Vorliegen mehrerer psychischer Stö- 
rungen eher die Regel als die Ausnahme. Zu den häufigsten psychischen Störungen 
im Erwachsenenalter gehören Angststörungen, Depression und Suchterkrankun- 
gen (vgl. Jacobi et al. 2014). Im Kindes- und Jugendalter zeigt sich ein ähnliches 
Bild, wobei hier ebenfalls Angststörungen und Depression, aber auch Störungen 
des Sozialverhaltens und Hyperkinetische Störungen am häufigsten vorkommen 
(vgl. Barkmann/Schulte-Markwort 2012; Ravens-Sieberer et al. 2007). 

Psychische Störungen beeinträchtigen den gesamten Lebensalltag der Betrof- 
fenen, sowohl privat als auch beruflich. So zeigen Daten der DAK Gesundheit, dass 
die Anzahl an Tagen mit Arbeitsunfähigkeitsmeldungen aufgrund von psychischen 
Störungen in den letzten Jahren deutlich gestiegen ist — von 1997 bis 2016 hat sich 
die Zahl mehr als verdreifacht. Damit begründen psychische Störungen die zweit- 
größte Zahl an Arbeitsunfähigkeitstagen pro Jahr nach den Krankheiten des Mus- 
kel-Skelett-Systems (vgl. Marschall et al. 2017). 

Unbehandelt nimmt ein großer Teil der psychischen Störungen einen chro- 
nischen oder rezidivierenden Verlauf — mit entsprechenden Einschränkungen in 
der psychosozialen Funktionsfähigkeit der Betroffenen. Auch für die Angehörigen 
und das Umfeld ist eine psychische Erkrankung mit substanziellen Belastungen 
assoziiert. Schwere psychische Störungen können zudem ein Risikofaktor für die 
Entwicklung suizidalen Erlebens und Verhaltens sein (vgl. Glaesmer et al. 2020). 
Der Suizid stellt weltweit eine der häufigsten Todesursachen dar. Die meisten Men- 
schen, die durch einen Suizid versterben, litten im Vorfeld an einer psychischen 
Störung (vgl. Nock et al. 2012). 
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1.1 Definition psychische Störung 


Nach einer verbreiteten Definition der American Psychological Association (APA) 
wird unter einer psychischen Störung ein Verhaltens- oder psychisches Syndrom 
verstanden, das einhergeht mit 


- erheblichem Leiden aufseiten des Individuums und/oder 

— deutlicher Einschränkung der normalen Lebensführung der Person, ihrer beruf- 
lichen oder schulischen Leistung oder sozialen Aktivitäten und Beziehungen 
und/oder 

— stark erhöhtem Risiko zu sterben, Schmerz, Beeinträchtigung oder einen tiefgrei- 
fenden Verlust an Freiheit zu erleiden. 


Unabhängig vom ursprünglichen Auslöser der Störung muss bei der betroffenen 
Person eine verhaltensmäßige, psychische, entwicklungsbezogene oder biologi- 
sche Funktionsstörung zu beobachten sein (vgl. American Psychiatric Association 
2013; s. auch Wittchen et al. 2020). Die einzelnen konkreten operationalisierten 
Kriterien, die für die Vergabe einer konkreten Diagnose einer psychischen Störung 
erfüllt sein müssen, sind in der International Classification of Diseases, die aktuell in 
der 10. Version vorliegt, definiert (vgl. ICD-10; Dilling et al. 2016). 


1.2 Epidemiologie psychischer Störungen 


Insgesamt sind psychische Störungen relativ häufig. Als epidemiologische 
Kenngrößen sind hierbei die Inzidenz, d.h. die Anzahl an Neuerkrankungen in 
einer bestimmten Zeitperiode, die Prävalenz, d.h. die Anzahl an Krankheitsfällen 
in einer bestimmten Zeitperiode, und die Mortalität, d.h. die krankheitsbezogene 
Sterblichkeit, zu differenzieren. Entsprechend den Ergebnissen des German Health 
Interview and Examination Survey for Adults — Mental Health Module, für den Daten 
einer bevölkerungsrepräsentativen Stichprobe von N=5.303 Personen vorliegen, 
liegt die 12-Monatsprävalenz für psychische Störungen bei 27,7 %. Somit ist inner- 
halb eines Jahres mehr als ein Viertel der erwachsenen Bevölkerung Deutschlands 
an einer psychischen Störung erkrankt. Bei Frauen liegt der Wert mit 33,3 % sogar 
noch leicht darüber (vgl. Jacobi et al. 2014). 

Die Prävalenz unterscheidet sich für die verschiedenen psychischen Störungen 
jedoch deutlich. Zu den besonders häufigen Störungen zählen z.B. die unipolare 
Depression (12-Monatsprävalenz 7,7%) oder die Agoraphobie (4,0%). Andere 
bekannte Störungen wie die Anorexia Nervosa (0,7 %), die Panikstörung (2,0 %) 
oder die bipolare Störung (1,5%) sind hingegen deutlich seltener (vgl. Jacobi et 
al. 2014). 
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Ergebnisse empirisch-quantitativer Forschung tragen in Psychiatrie, klinischer 
Psychologie, Erziehungs- und Sozialwissenschaften zu einem besseren Verständ- 
nis von Entstehung und Verlauf, adäquater psychosozialer Versorgung und gesell- 
schaftlicher Unterstützung von Menschen mit psychischen Störungen maßgeblich 
bei und sind angesichts der großen Verbreitung psychischer Störungen sowie der 
mit ihnen einhergehenden Belastungen und Einschränkungen für Betroffene und 
Angehörige von großer Bedeutung. Empirische Forschung ist nun jedoch beson- 
ders darauf angewiesen, diagnostischen Zugang zu den zu untersuchenden Ziel- 
gruppen zu haben und diese in ausreichender Anzahl für eine Studienteilnahme 
gewinnen zu können. Im Falle von Menschen mit einer psychischen Störung stellen 
sich hierbei verschiedene Herausforderungen, die es bei der Planung einer Studie 
hinsichtlich der Teilnehmendenrekrutierung sowie der anschließenden Datener- 
hebung zu berücksichtigen gilt. In diesem Beitrag werden einige dieser Herausfor- 
derungen beschrieben und diesbezügliche Lösungsvorschläge skizziert. 


2 _Herausforderungen 


2.1 Prävalenz einzelner psychischer Störungen 


Obwohl psychische Störungen insgesamt zu den häufigen Erkrankungen gehören, 
unterscheiden sie sich, wie in Abschnitt 1.2 beschrieben, hinsichtlich ihrer Präva- 
lenz teilweise deutlich. So ist es denkbar, dass sich im Zusammenhang mit einem 
empirisch-quantitativen Forschungsvorhaben bei Menschen mit psychischen Stö- 
rungen folgende Herausforderung stellt: 


Herausforderung: Sie möchten Menschen mit einer seltenen psychischen 
Störung (z. B. Panikstörung) untersuchen. 


Bei einer Prävalenz von 2% müssten Sie 5.000 Personen der Allgemeinbevölke- 
rung untersuchen, um auf N=100 Menschen mit dieser Indikation zu kommen. 


Hierbei handelt es sich um ein sehr häufiges Problem bei der Forschung mit Men- 
schen mit psychischen Störungen, dem mit verschiedenen Strategien begegnet 
werden kann. Auch eine Kombination dieser Strategien ist möglich und kann sinn- 
voll sein. 
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1. Breit gestreuter Studienaufruf mit transparenter Nennung von Ein- und 
Ausschlusskriterien 


Je nach Studiendesign kann der Rekrutierungsaufwand deutlich reduziert wer- 
den, indem im Studienaufruf bereits transparent die Ein- und Ausschlusskriterien 
genannt werden und infrage kommende Personen dazu aufgerufen werden, sich 
selbst aktiv beim Studienteam zu melden. Hierdurch erreicht man eine gewisse 
Selbstselektion. Der Anteil der Personen, die die Ein- und Ausschlusskriterien tat- 
sächlich erfüllen, sollte in dieser vorausgelesenen Stichprobe deutlich höher sein 
als in der Allgemeinbevölkerung, wodurch der diagnostische Aufwand erheblich 
reduziert werden kann. 


2. Gezielte Bewerbung der Studie in sozialen Medien (z.B. Facebook”) 


Soziale Medien ermöglichen die schnelle und weitgefächerte Verbreitung von 
Informationen in alle Bereiche der Gesellschaft. Auch für die Verbreitung von 
Studienaufrufen lassen sich soziale Medien nutzen. Insbesondere Angebote, die 
themen- oder zielgruppenspezifische Kommunikationsmöglichkeiten bieten, etwa 
durch Facebook-Gruppen oder entsprechende Instagram’-Kanäle, ermöglichen 
die Übermittlung von Studienaufrufen an infrage kommende Personen. Im Rah- 
men einer Befragung von Pflegepersonen, deren Ergebnisse kürzlich veröffentlicht 
wurden, konnten so z.B. binnen kurzer Zeit über 1.200 die Einschlusskriterien er- 
füllende Personen für die Teilnahme an der Studie gewonnen werden. Dies wurde 
u.a. möglich durch das Teilen des Studienaufrufs auf einem bei der Zielgruppe be- 
liebten Instagram’”-Kanal (vgl. Höller/Forkmann 2022). 


3. Gezielte Rekrutierung in spezialisierten Versorgungseinrichtungen 


Eine ebenso naheliegende wie verbreitete Methode ist zudem die gezielte Rekrutie- 
rung in spezialisierten Versorgungseinrichtungen. Hierzu zählen, je nach gesuch- 
tem Störungsbild, psychiatrische oder psychosomatische Kliniken, spezialisierte 
Ambulanzen (z.B. zum Thema Sucht), psychotherapeutische Ambulanzen oder 
auch niedergelassene Psychotherapeut:innen, Psychiater:innen oder Neurolog:in- 
nen. 

Ein Beispiel für eine auf diesem Wege gut rekrutierbare Personengruppe sind 
Menschen nach einem Suizidversuch. Suizidversuche sind zwar deutlich häufiger 
als Suizide; in Deutschland starben im Jahr 2020 9.206 Menschen durch einen 
Suizid (Bundesamt 2021). In der deutschen Gesamtbevölkerung sind Suizidver- 
suche jedoch mit einer Lebenszeitprävalenz von 1,7% recht selten (vgl. Nock et 
al. 2014). Suizidversuche gelten dabei, neben psychischen Erkrankungen, als be- 
deutsamster Prädiktor für Suizide (vgl. Franklin et al. 2017). In einer multizentri- 
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schen prospektiven Beobachtungsstudie konnten mittels gezielter Rekrutierung in 
13 verschiedenen psychiatrischen Kliniken in Deutschland N=308 Personen, die 
wegen eines Suizidversuchs bzw. einer akuten suizidalen Krise in stationärer Be- 
handlung waren, für eine Studie mit einem Nachbeobachtungszeitraum von zwölf 
Monaten gewonnen werden. Ziel des Projektes war es, die Kernannahmen einer 
der aktuell bedeutsamsten Theorien zur Entstehung suizidalen Erlebens und Ver- 
haltens, der Interpersonal Psychological Theory of Suicide (IPTS; vgl. Joiner 2005) 
prospektiv zu untersuchen. Mit der durch gezielte Rekrutierung in Versorgungsein- 
richtungen erreichten Stichprobengröße konnten alle vorab geplanten inferenzsta- 
tistischen Analysen mit ausreichender statistischer Power berechnet werden (vgl. 
Forkmann et al. 2021; Forkmann et al. 2020; Höller et al. 2021; Rath et al. 2021; 
Roland et al. 2022). 

Auch die Kombination aus einer Verbreitung des Studienaufrufs über soziale 
Netzwerke und einer gezielten Rekrutierung in spezialisierten Versorgungseinrich- 
tungen kann zur Anwendung kommen. Ein Projekt, das diese Strategie nutzte, um 
eine gemischte Stichprobe von Menschen mit unterschiedlichen Ausprägungsgra- 
den psychischer Beschwerden zu rekrutieren, konnte letztlich innerhalb weniger 
Wochen N=437 Personen für eine Studienteilnahme gewinnen (vgl. Forkmann et 
al. 2022). 


2.2 Zugang zu Versorgungseinrichtungen 


Wie in Abschnitt 2.1 geschildert, ist die Rekrutierung über spezialisierte Versor- 
gungseinrichtungen eine mögliche Strategie zur Gewinnung von Personengruppen 
mit eher seltenen psychischen Störungen. Hierbei kann sich folgende Problemlage 
ergeben: 


Herausforderung: Versorger:innen (z. B. Ärzt:innen, Pflegepersonal) haben eine 
hohe Arbeitslast und sind an etwaigem zusätzlichem Aufwand durch eine For- 
schungsstudie nicht interessiert. 


Obwohl die gezielte Rekrutierung über spezialisierte Versorgungseinrichtungen er- 
folgversprechend zur Erreichung von Menschen mit psychischen Störungen ist, 
kann der Zugang zu diesen Einrichtungen schwierig sein. 


Auch für die Bewältigung dieser Herausforderung bietet sich eine Reihe unter- 
schiedlicher Herangehensweisen an, die auch in Kombination angewandt werden 
können. 
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1. Begrenzung des Aufwandes für die Versorgungseinrichtungen 


Es ist sinnvoll, im Rahmen von persönlichen Terminen mit der jeweiligen Einrich- 
tungsleitung (häufig Chefärzt:innen, Pflegedienstleitungen o.Ä.) das geplante 
Projekt knapp(!) und präzise, aber gleichsam transparent vorzustellen. Hierbei 
gilt es zum einen nicht nötige Hintergrundinformationen zu vermeiden und zum 
anderen gleichzeitig das natürliche Informationsinteresse des potenziellen Koope- 
rationspartners ernst zu nehmen und zu erfüllen. Bereits vor diesem Termin sollte 
das Ausmaß an notwendiger Mitarbeit bei der Rekrutierung durch Personal der 
Einrichtung klar definiert werden, sodass es zum Zeitpunkt des Gesprächs mit der 
Einrichtungsleitung präzise benannt werden kann. Hierbei sollte wenn möglich 
jegliche Mehrarbeit für das Einrichtungspersonal vermieden und das eigene An- 
liegen auf den bloßen Zugang zu den Klient:innen bzw. Patient:innen reduziert 
werden. Für einen erfolgreichen und reibungslosen Ablauf der Rekrutierung ist es 
zudem wichtig, eine:n konkrete:n Ansprechpartner:in aufseiten der Einrichtung zu 
vereinbaren sowie Abläufe und Routinen im Rahmen der Rekrutierung zu bespre- 
chen. 


2. Vereinbarung von Incentives 


Es ist sinnvoll, im Vorfeld der ersten persönlichen Kontaktaufnahme mit der Einrich- 
tungsleitung zu überlegen, welche Anreize (sogenannte „Incentives“) der Einrich- 
tung für eine Teilnahme geboten werden können. Häufig genutzte Möglichkeiten 
sind hierbei das Angebot eines Vortrags oder einer Fortbildungsveranstaltung in 
der Einrichtung (z.B. im Zusammenhang mit dem eigenen Forschungsthema), die 
zeitnahe Rückkopplung der Studienergebnisse in die Einrichtung oder auch, so- 
fern wissenschaftsethisch gerechtfertigt, die Beteiligung an Publikationen aus dem 
Forschungsprojekt. Sollten derartige Anreize vereinbart werden, empfiehlt es sich, 
diese schriftlich und verbindlich festzuhalten. 

Unabhängig von der Verwendung von Teilnahmeanreizen für die jeweilige 
Einrichtung, in der die Rekrutierung stattfinden soll, empfiehlt es sich zudem, bei 
grundsätzlicher Bereitschaft der Einrichtung, an der Rekrutierung von Personen 
zu partizipieren, die entsprechende Einrichtungsleitung um eine schriftliche Ko- 
operationserklärung zu bitten. In dieser können auch die bereits genannten Teil- 
nahmeanreize festgehalten sowie andere Details geregelt werden. Ein Beispiel für 
eine einfache Kooperationserklärung findet sich im folgenden Kasten: 


161 


4.2 Empirische Forschung mit Menschen mit psychischen Störungen 


Sehr geehrte:r Herr/Frau ..., 


in meiner Funktion als Chefarzt/Chefärztin der Klinik ... erkläre ich mich gerne zur 
Kooperation im Rahmen des Projekts „...“ bereit. 

Im Rahmen dieser Kooperation unterstütze ich aktiv die Rekrutierung von Pati- 
ent:innen der Klinik ... für die Studie und gewähre dafür den Studienmitarbeiter:in- 
nen Zugang zu meiner Klinik. Die Studienunterlagen sind mir bekannt und ich bin 
mit diesen einverstanden. 


Mit freundlichen Grüßen 


2.3 Krankheitsbedingte Besonderheiten 


Psychische Störungen sind gekennzeichnet durch Symptome in den Bereichen 
Emotion, Kognition, Motivation, Verhalten und Physiologie (vgl. Margraf 2000). 
Derartige Symptome sind mit ausgeprägtem subjektivem Leid, psychosozialer 
Funktionseinschränkung und Belastungen für Angehörige und das soziale Um- 
feld assoziiert (vgl. Dilling et al. 2016). Teile dieser krankheitsbedingten Symp- 
tome können auch die Datenerhebung bei Menschen mit psychischen Störungen 
erschweren. 


Herausforderung: Die Datenerhebung bei Menschen mit psychischen Störungen 
erfordert deren Teilnahme an z.B. Interviews, Fragebogenuntersuchungen oder 
Leistungstests. 


Krankheitsbedingte Besonderheiten können die Durchführung dieser Untersuchun- 
gen erschweren. 


Im Rahmen von depressiven Störungen sind Symptome wie Konzentrations- und 
Entscheidungsschwierigkeiten, Energiemangel, Rumination oder auch ein Verlust 
des Antriebs typisch (vgl. Kring et al. 2019). Bei bestimmten Persönlichkeitsstörun- 
gen, wahnhaften oder schizophrenen Störungen kann es zu ausgeprägtem Miss- 
trauen oder auch zu Wahrnehmungsstörungen kommen. Je nach gegenwärtiger 
Lebenssituation kann der bzw. die Klient:in zudem motiviert sein, sozial erwünscht 
zu antworten oder die gegenwärtige Symptomatik als besonders ausgeprägt oder 
gering erscheinen zu lassen (vgl. Knappe et al. 2020). 
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Um einer Beeinträchtigung der Datenerhebung entgegenzuwirken und eine 
hohe Validität und Reliabilität der erhobenen Daten sicherzustellen, sollte eine 
Reihe von Maßnahmen beherzigt werden. 


1. Angemessene Gesprächsführung 


In der Arbeit mit Menschen mit psychischen Störungen ist es besonders wichtig, 
den persönlichen Kontakt angemessen zu gestalten. So sollte sich genügend Zeit 
für die Datenerhebung genommen und damit ein Zeitpuffer für persönliche An- 
liegen des bzw. der Betroffenen und unerwartete Verläufe eingeplant werden. Im 
Kontakt sollte den Klient:innen mit Geduld, Empathie und Wertschätzung begeg- 
net werden. Das Gespräch sollte klar strukturiert sein; Instruktionen sollten ein- 
fach, klar und auf das Wesentliche reduziert erfolgen. Es sollte von vornherein 
eingeplant werden, dass in Untersuchungsterminen ggf. Pausen eingestreut oder 
Untersuchungen auch auf mehrere Termine verteilt werden müssen (vgl. Hoyer/ 
Wittchen 2020). 


2. Zielgruppenspezifisches Assessment 


In Kenntnis der krankheitsbedingten Besonderheiten der Zielgruppe sollte erwogen 
werden, bereits im Vorfeld ein zielgruppenspezifisches Assessment zu konzipieren. 
Hierdurch kann es ggf. gelingen, Störungen im Verlauf oder der Qualität der Daten- 
erhebung zu minimieren. So sollte bei Menschen, die zum Untersuchungszeitpunkt 
unter akuten schweren psychischen Störungen leiden (z.B. schwere Depression), 
darauf geachtet werden, das Assessment so kurz wie möglich zu gestalten. Hier- 
für können besonders kurze Fragebögen ausgewählt oder Interviewleitfäden ge- 
zielt auf das Wesentliche beschränkt werden. Fragebögen, die Ratingskalen als 
Antwortmöglichkeiten verwenden, sollten so ausgewählt oder konstruiert werden, 
dass sie die Klient:innen nicht überfordern. So konnte z.B. in einer empirischen 
Studie mit N=44 Personen, die zum Untersuchungszeitpunkt unter einer depressi- 
ven Störung litten, gezeigt werden, dass Menschen mit einer depressiven Störung 
nur maximal vier bis fünf verbale Anker einer Ratingskala (z.B. selten, manchmal, 
häufig etc.) sinnvoll voneinander diskriminieren können (vgl. Krabbe/Forkmann 
2012, 2014). Entsprechend sollten Fragebögen mit Ratingskalen, die eine größere 
Anzahl an Antwortkategorien verwenden, in dieser Zielgruppe vermieden werden. 

Auch über die primäre psychische Störung hinaus können Attribute der zu 
untersuchenden Zielgruppe ein entsprechend angepasstes Assessment notwendig 
machen. So fanden sich in Studien z.B. wiederholt artifiziell erhöhte Depressions- 
werte bei Menschen mit körperlichen Komorbiditäten. Spangenberg et al. (2011) 
zeigten, dass das Depressionsmodul des sehr verbreiteten Patient Health Questi- 
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onnaire (PHQ-9) auf einzelnen Items höhere Werte liefert, wenn die untersuchten 
Personen zusätzlich zur Depression auch somatisch erkrankt sind (s. auch Fork- 
mann et al. 2013). Eine mögliche Lösung dieser Problematik bietet die Verwen- 
dung von Instrumenten, die gezielt für den Einsatz bei Menschen mit körperlichen 
Komorbiditäten entwickelt und dahingehend geprüft wurden, in diesen Gruppen 
valide Messwerte zu erzielen. Beispiele für solche Instrumente sind die Hospital 
Anxiety and Depression Scale (HADS; vgl. Herrmann et al. 1995; Zigmond/Snaith 
1983) sowie das Rasch-basierte Depressionsscreening (DESC; vgl. Forkmann et al. 
2012; Forkmann et al. 2009; Forkmann et al. 2010). Auch der Einsatz altersange- 
messener Instrumente sollte erwogen werden. Zur Messung von Depressivität im 
Alter steht z.B. die Geriatrische Depressionsskala (GDS) zur Verfügung (vgl. Gaug- 
gel/Birkner 1998; Yesavage 1988). 


2.4 Einholen der informierten Einwilligung zur Studienteilnahme 


Bei allen empirischen Studien am Menschen müssen die teilnehmenden Personen 
im Vorfeld angemessen aufgeklärt werden. Hierzu gehören u.a. Informationen zu 
Ziel, Zweck und Ablauf der Studie, zur Freiwilligkeit der Teilnahme, den geltenden 
Datenschutzbestimmungen und der geplanten Datenverwendung, den Rechten 
auf Abbruch und Datenlöschung der bzw. des Teilnehmenden sowie etwaigen mit 
der Untersuchung einhergehenden Risiken. Den Teilnehmenden soll Gelegenheit 
gegeben werden, im Vorfeld diesbezüglich Fragen zu stellen. Anschließend ist es 
erforderlich, dass sie ihr Einverständnis zur Teilnahme an der Untersuchung frei- 
willig erklären (vgl. World Medical Association 2001). 


Herausforderung: Es ist notwendig, stets ein informiertes Einverständnis zur 
Studienteilnahme sicherzustellen. 


Dies kann je nach Studienpopulation und Studiendesign erschwert sein. 


Im Normalfall sind für eine Studienteilnahme infrage kommende Personen von 
Mitarbeitenden des Forschungsprojektes schriftlich und mündlich über die oben 
genannten Dinge aufzuklären. Die Teilnehmenden unterschreiben anschließend 
handschriftlich eine entsprechende Einwilligungserklärung, die unabhängig von 
den Studiendaten verwahrt wird. Lösungen für Sonderfälle, die ein Abweichen von 
diesem Vorgehen notwendig machen, können jedoch erforderlich sein. 
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1. Online-Erhebungen 


Wenn es die jeweilige Forschungsfrage erlaubt, können Befragungen von Studien- 
teilnehmenden auch online, d.h. ohne persönlichen Kontakt mit Mitarbeitenden 
des Projektteams, durchgeführt werden. Hierbei entfällt zum einen die Möglich- 
keit, offene Fragen zur Studie direkt mündlich zu stellen. Hierfür sollte die Funk- 
tion eingerichtet sein, diese Fragen per E-Mail direkt ans Projektteam zu richten, 
bevor das Einverständnis zur Teilnahme erklärt wird. Zum anderen können die Stu- 
dieninteressierten ihre Einwilligung zur Teilnahme nicht handschriftlich erklären. 
Alternativ ist jedoch im Rahmen von Online-Erhebungen auch die Einwilligung per 
Check-Box üblich. 


2. Besondere rechtliche Rahmenbedingungen 


Zeigt sich ein:e Patient:in bei bestehender akuter Selbst- oder Fremdgefährdung 
mit einer konkreten Handlungsabsicht nicht absprachefähig oder möchte kei- 
ne Absprachen treffen, kann eine Unterbringung in einer psychiatrischen Klinik 
gegen den Willen der Person notwendig werden. Die diesbezüglichen rechtlichen 
Grundlagen sind in Deutschland das PsychKG (Psychisch-Kranken-Gesetz, oder je 
nach Bundesland: Unterbringungsgesetz oder Freiheitsentziehungsgesetz) und die 
Unterbringung nach dem BGB § 1906 (Bürgerliches Gesetzbuch) (vgl. Teismann 
et al. 2016). In solch einer Situation ist eine Untersuchung des Patienten bzw. der 
Patientin zu wissenschaftlichen Zwecken ggf. unmöglich. In jedem Fall sollte die 
rechtliche Situation bedacht und in Absprache mit den behandelnden Ärzt:innen 
und Therapeut:innen abgewogen werden, inwieweit eine Untersuchung zu wissen- 
schaftlichen Zwecken angemessen ist. 

Eine Unterbringung nach BGB 8 1906 kann nur bei bestehender gesetzlicher 
Betreuung erfolgen. Auch ohne akute Gefährdungssituation und damit eventuelle 
Unterbringungsnotwendigkeit ist ein bestehendes Betreuungsverhältnis im Rah- 
men wissenschaftlicher Untersuchungen unbedingt zu berücksichtigen. Hierbei 
ist zu beachten, auf welche Regelungsbereiche sich die Betreuungsvollmacht der 
Betreuungsperson erstreckt (z.B. Gesundheitsfürsorge, Aufenthaltsbestimmungs- 
recht, finanzielle Angelegenheiten). In Abhängigkeit hiervon kann es notwendig 
sein, im Vorfeld einer Studienteilnahme - ggf. zusätzlich zur Einwilligung des bzw. 
der Patient:in — auch die Zustimmung zur Studienteilnahme seitens der Betreu- 
ungsperson einzuholen. Es ist zu empfehlen, sich in einem solchen Fall vor dem 
Beginn der Datenerhebung eingehend juristisch zu informieren. 


165 


4.2 Empirische Forschung mit Menschen mit psychischen Störungen 


3. Wiederholte Datenerhebungen 


Sollten im Rahmen eines Forschungsprojektes in einem Längsschnittdesign wie- 
derholte Datenerhebungen an den gleichen Personen geplant sein, muss unbedingt 
bei der ersten Datenerhebung das schriftliche Einverständnis zur erneuten Kon- 
taktaufnahme eingeholt werden. Da es je nach Abstand zwischen den geplanten 
Messzeitpunkten auch zu größeren Veränderungen im Alltag der Teilnehmenden 
kommen kann (z.B. Umzug), hat es sich als nützlich erwiesen, darüber hinaus die 
Teilnehmenden um das Einverständnis zu bitten, ggf. auch eine:n Angehörige:n 
oder eine:n behandelnde:n Ärzt:in kontaktieren zu dürfen, sollte der bzw. die Pa- 
tient:in selbst nicht erreichbar sein. 


3 Fazit 


Die Durchführung empirischer Untersuchungen bei Menschen mit psychischen 
Störungen kann herausfordernd sein. Zu den häufigen Herausforderungen in die- 
sem Zusammenhang gehören die geringe Prävalenz einzelner Störungen, der Zu- 
gang zu Versorgungseinrichtungen, störungsbedingte Besonderheiten im Erleben 
und Verhalten der Betroffenen sowie Hürden beim Einholen des informierten Ein- 
verständnisses (,,informed consent“) im Vorfeld einer Untersuchung. Entsprechend 
ist bereits bei der Planung einer Studie, bei der Wahl der Rekrutierungsstrategie, 
der Anbahnung möglicher Kooperationsvereinbarungen und bei der Durchführung 
selbst die Berücksichtigung einiger praktischer, teils recht einfacher Maßnahmen 
zu empfehlen, die die Durchführung erleichtern können. Die Beherzigung dieser 
Empfehlungen kann dazu beitragen, die Wahrscheinlichkeit einer erfolgreichen 
Teilnehmendenrekrutierung und der Gewinnung valider Forschungsdaten zu er- 
höhen. Auch Studierende der Bildungs- und Sozialwissenschaften sollten bei der 
Planung von empirischen Studien- und Abschlussarbeiten diese Aspekte rechtzei- 
tig berücksichtigen und z.B. mit ihren Betreuer:innen hierzu Rücksprache halten. 
Weiterführende Informationen finden sich u.a. in Lehrbüchern der Klinischen Psy- 
chologie (z.B. Knappe/Hoyer 2021; Kring et al. 2019) oder der psychologischen 
Diagnostik (z.B. Schmidt-Atzert et al. 2022). Empirisch-quantitative Forschungs- 
strategien sind in Psychiatrie, klinischer Psychologie, Bildungs-, Erziehungs- und 
Sozialwissenschaften für viele Forschungsfragen ein angemessener und zielfüh- 
render methodischer Zugang. Je nach konkreter Fragestellung sollten allerdings 
auch andere, z.B. qualitative, Herangehensweisen erwogen werden. 
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4.3 Empirische Forschung mit Menschen 
mit „Lebensmittelpunkt Straße“ - 
Herausforderungen in Rekrutierung und 
Datenerhebung 


Kai Hauprich 


So sicher, wie die Begriffe „Obdachloser“ oder „wohnungslose Menschen“ bei 
Mehrheitsgesellschaft und auch bei Forschenden Bilder und Vorannahmen abru- 
fen, so schnell wird bei dem Versuch einer exakten Zielgruppenbestimmung für 
eine Untersuchung im Feld der Wohnungslosigkeit deutlich, dass solche Bilder und 
Annahmen ins Leere greifen, da sie auf historisch gewachsenen, alltagstheoreti- 
schen Vorurteilen und Stereotypen beruhen (vgl. Hauprich 2021; Gerull 2018). 
Dies beginnt mit der fälschlichen Verwendung der Begriffe „wohnungslos“ und 
„obdachlos“ als Synonyme und reicht bis hin zur Überformung und Stilisierung 
obdachloser Menschen zu Sozialfiguren (vgl. Hauprich 2021). Eine wesentliche 
Herausforderung bei der Erhebung von Daten im Kontext von Wohnungslosigkeit 
und Obdachlosigkeit besteht tatsächlich darin, die zu untersuchende Zielgruppe 
exakt abzugrenzen sowie die Bestimmung einer geeigneten Grundgesamtheit vor- 
zunehmen. 

Für Deutschland gibt es immer noch keine einheitliche offizielle Definition von 
Obdachlosigkeit, die hierzu herangezogen werden könnte. Die gesetzlichen Nor- 
men, die das rechtliche Fundament für die deutsche Wohnungslosenhilfe bilden 
(88 67-69 SGB XII) eignen sich ebenfalls nicht als Anker zur Begriffsbestimmung, 
da dort lediglich von Personen die Rede ist, bei denen „besondere Lebensverhält- 
nisse mit sozialen Schwierigkeiten verbunden sind“. Diese begriffliche Unschär- 
fe entsteht vor allem deshalb, weil es sich bei Wohnungslosigkeit um komplexe, 
multidimensionale Armutsphänomene handelt, sodass sich sowohl die Gruppe der 
obdachlosen Menschen als auch die sogenannten Menschen in Wohnungsnot aus 
einer Vielzahl von Subgruppen zusammensetzen, die wiederum von verschieden- 
artigen sozialen Armutsphänomenen betroffen sind. Diese bedingen sich wech- 
selseitig und können daher nicht völlig losgelöst voneinander betrachtet werden. 
Neben fehlendem Normalwohnraum gehören zu solch besonderen Lebensverhält- 
nissen ebenfalls Erwerbslosigkeit, Schulden, körperliche und seelische Krankheit 
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sowie Sucht, Straffälligkeit und weitere verschiedenartige Formen sozialer Desin- 
tegration. Zu Beginn einer Untersuchung in diesem Feld ist es daher ratsam, genau 
zu definieren, welches dieser sozialen Armutsphänomene im Fokus der Forschung 
stehen soll. Die oben beschriebene Multikomplexität macht das Feld für sozialwis- 
senschaftliche Untersuchungen besonders interessant, ist aber nicht ohne Weiteres 
in ein aussagekräftiges Forschungsdesign zu überführen. 

Begriffs- und Zielgruppenbestimmungen im deutschen Kontext folgen re- 
gelmäßig der Wohnungsnotfalldefinition der Bundesarbeitsgemeinschaft Woh- 
nungslosenhilfe (vgl. BAG W 2010): „Wohnungslos ist, wer nicht über einen 
mietvertraglich abgesicherten Wohnraum (oder Wohneigentum) verfügt.“' Der 
Begriff Wohnungslosigkeit verweist hier zunächst nur auf eine fehlende mietver- 
tragliche Absicherung von Wohnraum. Die Gruppe der wohnungslosen Menschen 
umfasst somit auch Personen, die in Sonderwohnformen der Wohnungslosenhilfe 
leben, Personen die ordnungsbehördlich untergebracht sind und auch alle diejeni- 
gen, die in verdeckter Wohnungslosigkeit bei Freund:innen oder Bekannten leben. 
Außerdem gehören dazu spezifische Subgruppen wie Menschen, die aus Justiz- 
vollzugsanstalten entlassen werden, in Flüchtlingsunterkünften untergebracht 
sind oder auch Einrichtungen der Jugendhilfe verlassen haben (vgl. FEANTSA 
2020; BAG W 2010). Menschen, die tatsächlich obdachlos leben, d.h., buchstäb- 
lich im öffentlichen Raum, in Verschlägen, unter Brücken und in Fußgängerzonen 
und anderen öffentlichen Plätzen auf der Straße schlafen — im Jargon: „Platte ma- 
chen“ — machen nur einen geringen Teil (etwa ein Zehntel) aller wohnungslosen 
Menschen aus (vgl. Hauprich 2021). Dies bezieht sich auch auf Personen, die ohne 
jegliche Unterkunft, die als solche bezeichnet werden kann, ohne festen Wohnsitz 
leben und sich in Notschlafstellen, Wärmestuben oder niedrigschwelligen Einrich- 
tungen der Wohnungslosenhilfe aufhalten. Dies ist jedoch die Zielgruppe, die in 
einer Untersuchung zur Obdachlosigkeit adressiert werden soll. Viele Forschungs- 
projekte werben damit, Obdachlosigkeit untersucht zu haben, haben tatsächlich 
aber - vielleicht aufgrund fehlender Begriffsklarheit oder weil wohnungslose Men- 
schen leichter zu rekrutieren und zu befragen sind — das Phänomen Wohnungs- 
losigkeit bearbeitet. 

Für die Rekrutierung von Untersuchungsteilnehmenden und für die Erhebung 
von Daten im Kontext von Obdachlosigkeit sollte daher ausreichend Sorgfalt auf 
die Klärung der Frage nach Zielgruppe und Abgrenzung zu anderen Armutsphä- 
nomenen verwendet werden. Einen guten ersten Überblick über mögliche Aus- 
prägungen und Unterformen von Wohnungslosigkeit und spezifische Formen der 
Wohnungsnot bietet die von der Fédération Européenne d‘Associations Nationales 


1 Siehe dazu auch: https://www.bagw.de/de/themen/zahl-der-wohnungslosen/wohnungs- 
notfalldefinition.html [Zugriff: 02.04.2022]. 
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Travaillant avec les Sans-Abri entwickelte Europäische Typologie für Wohnungs- 
losigkeit (ETHOS), die typische Erscheinungsformen von Wohnungsnot kategorial 
umschreibt (vgl. FEANTSA 2020). Hierzu gilt es jedoch anzumerken, dass es sich 
auch dabei um idealtypische Kategorien handelt, die durchaus ineinander ragen 
können, und dass konkrete Personen im Zeitverlauf ihrer „Straßenkarriere“ immer 
wieder mehrere dieser Kategorien durchlaufen (vgl. Hauprich 2021). Dies ist bei- 
spielsweise dann der Fall, wenn eine wohnungslose Person eine Einrichtung der 
Wohnungslosenhilfe verlassen muss, sodann obdachlos wird und vielleicht später 
in eine stationäre medizinische Einrichtung eingewiesen werden muss oder aber 
wegen einer Straftat wie Erschleichen von Leistungen („Schwarzfahren“) zeitweise 
in eine Justizvollzugsanstalt verbracht wird. Träger der Wohnungslosenhilfe adres- 
sieren, je nach Einrichtung und Institution, mit verschiedenen Gewichtungen alle 
die in der ETHOS-Typologie skizzierten Subgruppen. Bei Obdachlosigkeit handelt 
es sich also um eine spezifische Form der Wohnungslosigkeit, die ein residentielles 
Armutsphänomen darstellt, das aus sozialer Ungleichheit resultiert. 

Wer zur Straßenobdachlosigkeit forscht, dem ist deshalb z.B. zu raten, im Fra- 
gebogen abzuklären, ob Teilnehmende innerhalb der letzten 14 Tage mindestens 
einmal an einem Ort im öffentlichen Raum geschlafen haben, der originär nicht 
dafür vorgesehen ist. Wer seine Fragebögen jedoch „blind“ an eine Liste aller Fach- 
beratungsstellen nach § 67 SGB XII versendet, läuft Gefahr, im Ergebnis chronisch 
straßenobdachlose Menschen mit Frührentner:innen zu vergleichen, die eine Miet- 
vertragskündigung wegen Eigenbedarf erhalten haben. 


Erhebungsmethoden im Feld der Obdachlosigkeit 


Da es sich bei obdachlosen Menschen nicht um eine grundsätzlich „andere Gattung 
Mensch“ handelt, unterscheiden sich die quantitativen und qualitativen Methoden, 
die zur Erhebung von Datenmaterial Anwendung finden können, nicht von jenen, 
die auch in anderen Feldern der sozialwissenschaftlich empirischen Forschung 
etabliert sind. Die Frage, wie man obdachlose Menschen nun wissenschaftlich be- 
fragen könnte und sollte, lässt sich mit folgender Gegenfrage beantworten: Wie 
kann und sollte man andere soziale Gruppen wissenschaftlich befragen? Hierbei 
handelt es sich nicht um eine sozialkritische, rhetorische Figur, sondern um eine 
ernstgemeinte Empfehlung, denn häufig werden zur Befragung obdachloser Men- 
schen aufwendige und außergewöhnliche Forschungsdesigns angewandt, die bei 
kritischer Selbstbetrachtung oft mehr die Funktion erfüllen, dass die Forschenden 
nicht persönlich zu nah an die zu untersuchende Gruppe herantreten müssen, da 
sie sich im Feld unsicher fühlen. So werden durch spezielle Vorfilter (beispielswei- 
se Begrenzung auf „Expert:innen“-Interviews mit Sozialarbeiter:innen) und fal- 
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sche Grundannahmen über die Lebenswelt obdachloser Menschen (beispielsweise 
„Obdachlose sind nicht auskunftsfahig.“) immer wieder empirische Artefakte er- 
zeugt (vgl. von Treuberg 1990). Die Befragung von Sozialarbeiter:innen als von 
Forschenden definierte „Expert_innen der Obdachlosigkeit“ stellt dabei sowohl die 
gängigste Erhebungsform als auch die häufigste Fehlerquelle dar (vgl. ebd.). 

Dabei sind obdachlose Menschen aufgrund ihrer besonderen Lebensverhält- 
nisse bestimmten herausfordernden Alltagsbedingungen ausgesetzt, die es bei 
einer empirischen Untersuchung zu berücksichtigen gilt. Auch hat die Grundge- 
samtheit eine bestimmte Struktur und spezifische soziale Probleme erscheinen im 
Vergleich zur Mehrheitsgesellschaft häufiger, entweder weil sie selbst Prädiktoren 
für Obdachlosigkeit sind oder aber weil die besonderen Lebensverhältnisse diese 
sozialen Probleme und Deprivationen befördern. Auf sie wird im Folgenden ein- 
gegangen, wobei es sich weder um eine abschließende Auflistung aller denkbaren 
Herausforderungen einer empirischen Untersuchung in diesem Feld handelt noch 
um vorgestellte Umgangsstrategien als ideale Lösungen. 


Herausforderungen für quantitative Forschungsdesigns 


Wer eine quantitative, papiergestützte Datenerhebung durchführen möchte, steht 
vor der Herausforderung, dass obdachlose Menschen über keine Meldeadresse 
verfügen, unter der man sie erreichen könnte. Stattdessen nutzen viele von Stra- 
ßenobdachlosigkeit Betroffene Postfächer in niedrigschwelligen Einrichtungen 
der Wohnungslosenhilfe, zu deren regulären Dienstleistungen das Angebot solcher 
Postfächer gehört. Da die Post in den meisten Einrichtungen regelmäßig abgeholt 
werden muss, damit die Adresse weiter genutzt werden kann, besteht meist auch 
Kontakt zu den Sozialarbeiter:innen vor Ort. Dies bietet eine gute Gelegenheit, 
nicht nur Fragebögen auszuteilen, sondern zugleich persönlich über den Hinter- 
grund der Befragung aufzuklären und ggf. dabei auch Incentives auszuteilen. Die 
Sozialarbeiter:innen können außerdem in etwa einordnen, ob die gewünschte Ziel- 
gruppe erreicht wird. Ähnliches trifft auch auf ehrenamtlich organisierte Lebens- 
mittelausgaben zu, die regelmäßig von der gleichen Personengruppe aufgesucht 
werden. Werden mehrere Einrichtungen und Kontaktstellen auf diese Weise zu 
Befragungsorten, bietet es sich an, die Fragebögen über anonymisierte Identifier 
eindeutig zuzuordnen, um so Doppelansprachen auszuschließen. 

Die pragmatischste Herangehensweise, obdachlose Menschen zur Teilnahme 
an einer Befragung zu motivieren, ist es, sie im öffentlichen Raum an ihren Schlaf- 
plätzen, Treffpunkten und ggf. Bettelplätzen direkt anzusprechen. Hierbei ist je- 
doch im Blick zu behalten, dass dies als übergriffig empfunden werden könnte. Ob 
diese Form der Rekrutierung gewählt werden sollte, ist daher nicht ausschließlich 
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eine methodische, sondern auch eine forschungsethische Frage, weil Menschen, 
denen es an der ontologischen Sicherheit einer eigenen Wohnung fehlt, ungefragt 
in ihrem Behelfszuhause angesprochen werden. Dies kann über eine respektvol- 
le Ansprache durchaus gelingen, jedoch sollte man sich stets im Umkehrschluss 
vorstellen: Welche Wirkung könnte es z.B. auf Studienteilnehmende haben, wenn 
plötzlich Mitarbeitende eines Forschungsinstituts ungefragt auf ihrem Sofa sit- 
zen, um sie zur Teilnahme am ALLBUS zu überzeugen? Als vertrauensstiftende 
Maßnahme und Korrektiv in der Ansprache kann die Zusammenarbeit mit Street- 
worker:innen eine wertvolle Hilfe sein. Die Fachkräfte aufsuchender Hilfen für ob- 
dachlose Menschen sind in aller Regel gut vertraut mit den Gepflogenheiten in der 
Straßenobdachlosigkeit, kennen den überwiegenden Teil der Zielgruppe persön- 
lich und können daher vertrauensvoll vermitteln. Zudem kennen sie Schlafplätze, 
Orte der Zusammenkunft und Tagesrhythmen obdachloser Menschen. 

Eine weitere Rekrutierungsmöglichkeit bietet die Zusammenarbeit mit Peer 
Experts, d.h. (ehemals) obdachlosen Menschen, die dann beispielsweise eine 
Aufwandsentschädigung für das Verteilen von Fragebögen oder auch Befragung 
der Zielgruppe erhalten. Dabei ist jedoch zu beachten, dass dadurch das Sam- 
pling oft dem Prinzip des Schneeballverfahrens folgt, sodass es zu Verzerrungen 
kommen kann. Dennoch hat sich dieses Vorgehen in der Praxis der Obdachlosig- 
keitsforschung schon bewährt und ist demnach eine geeignete Möglichkeit, um 
angemessen große Samples zu erzeugen (vgl. Münch/Hauprich 2015). Mögliche 
gravierende Stichprobenverzerrungen lassen sich über nachgelagerte Expert:inne- 
ninterviews abfedern, in denen über einen gemeinsamen Blick auf die gesammel- 
ten Daten diskutiert wird, ob der Datensatz auffällige blinde Flecken in Bezug auf 
bestimmte zu erreichende Teilgruppen aufweist. In einem solchen Gespräch könn- 
te den Fachkräften oder ehemals Obdachlosen auffallen, dass gewisse Einrichtun- 
gen, Plätze oder Subgruppen unterrepräsentiert sind oder gänzlich fehlen. Hieran 
lässt sich bereits die besondere Qualität ablesen, die Mixed-Methods-Designs ins- 
besondere in Dunkelfeldern der empirischen Sozialforschung erzeugen, denn sie 
tragen — sofern richtig verschränkt und aufeinander bezogen — zur Minimierung 
empirischer Artefakte bei. 

Bei der Konstruktion von Fragebögen, die sich an obdachlose Menschen rich- 
ten, gelten ebenfalls die gängigen Empfehlungen der empirischen Sozialforschung 
(z.B. Porst 2014). Es gibt keinen Grund zur Annahme, dass diese Personengruppe 
nicht in der Lage wäre, selbst komplexere Fragebögen und Skalen zu bearbeiten. Die 
Aufbewahrung gedruckter Dokumente und Unterlagen gehört jedoch zu einer der 
klassischen Herausforderungen in der Obdachlosigkeit, sodass davon auszugehen 
ist, dass ein einfaches Austeilen von Fragebögen und späteres Wiedereinsammeln 
keine besonders erfolgversprechende Datenerhebungsvariante darstellt. Ad-hoc- 
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Befragungen vor Ort hingegen erzeugen erfahrungsgemäß höchste Rücklauf- 
quoten. Da die Settings solcher Befragungen und die Lebensbedingungen, denen 
obdachlose Menschen unterworfen sind, sich durch Zeitknappheit auszeichnen, ist 
es ratsam, einen Fragebogen so knapp oder gut bearbeitbar zu gestalten, dass ein 
vollständiges Ausfüllen in nicht mehr als 20 Minuten gelingen kann — und zwar die 
folgenden widrigen Umstände bereits miteinkalkuliert: Ausfüllen des Bogens im 
Stehen, im öffentlichen Raum und unter allerlei widrigen Wetterbedingungen. Es 
empfiehlt sich daher, sich das Befragungssetting vorab anzuschauen und nützli- 
che Utensilien wie Klemmbretter, Kugelschreiber, verschließbare Befragungsboxen 
und ggf. einfache Sitzgelegenheiten wie Klappstühle und Tische bereitzustellen. 
Der Erfolg einer Befragung obdachloser Menschen hängt häufig maßgeblich davon 
ab, wie gut die Forschenden eine sogenannte Paper-Assisted-Personal-Interview- 
Situation dirigieren und koordinieren können. 


Zum Einsatz von Incentives 


Wie bei anderen empirischen Untersuchungen stellt sich auch bei der Befragung 
obdachloser Menschen beim Feldzugang eine zentrale Frage, nämlich wie die 
zu befragenden Personen zur Teilnahme bewegt werden können, welche Anrei- 
ze geboten werden, um sich „zum Untersuchungsgegenstand machen zu lassen“ 
oder auch nur wie die „Menschen hinter den Zahlen“ für ihren Zeitaufwand und 
ihre Mühen angemessen entschädigt werden können. Der Einsatz von Incentives 
bewegt sich in der praktischen Sozialforschung stets im Spannungsverhältnis 
forschungsökonomischer, methodisch/methodologischer und auch wissenschafts- 
ethischer Erwägungen. Dabei müssen auch Mehrdeutigkeiten, Ambiguitäten und 
Widersprüche ausgehalten werden. Praktische Sozialforschung hat eher die Aufga- 
be, Abwägungen dieser Widersprüche zu treffen, diese in der Ergebnisdarstellung 
transparent zu machen und kritisch zu reflektieren, als „eine richtige methodische 
Lösung“ auszutüfteln. Es kann daher ratsam sein, ausreichend Zeit für verschiede- 
ne Pretests einzuplanen und Testläufe der Befragung an anderen Befragungsorten 
(beispielsweise in Nachbarstädten) unter Realbedingungen durchzuführen, um 
die tatsächlichen Herausforderungen des jeweiligen Forschungsdesigns erfahrbar 
zu machen, denn aufgrund der Begrenztheit der Befragungsgruppe und deren be- 
sonderer Sensibilität sind Wiederholungen der Befragung in aller Regel nicht mög- 
lich. Auch die Frage nach dem Einsatz von Incentives bei der Erhebung von Daten 
im Kontext Obdachlosigkeit — einer Situation absoluter Armut — verdeutlicht die 
beschriebenen Spannungsverhältnisse immer wieder: 

Grundsätzlich haben Einsatz oder Verzicht von Incentives im Feld der Ob- 
dachlosigkeit die allgemein bekannten und in den Sozialwissenschaften regelmä- 
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Big diskutierten Vorzüge und Nachteile für die Datenerhebung (vgl. Pforr 2015): 
Einerseits erhöhen insbesondere monetäre Incentives häufig die grundsätzliche 
Teilnahmebereitschaft, andererseits können sie auch zur Stichprobenverzerrung 
führen. Sie können die Vollständigkeit und Rücklaufquote der Fragebögen erhö- 
hen, jedoch beeinflussen sie mitunter auch das Antwortverhalten der Befragten 
und damit die Datenqualität. Incentives und Teilnahmeaufwandsentschädigungen 
können sich darüber hinaus in vielfacher Weise auf die Datenerhebung und Daten- 
qualität auswirken (siehe ebd.). 

Was ihren Einsatz oder Verzicht im Kontext von Obdachlosigkeit so besonders 
macht, sind u.a. folgende Erwägungen: Die zu befragenden Personen müssen häu- 
fig in kürzester Zeit für eine Teilnahme gewonnen werden, sodass ein handfestes 
Argument die Teilnahmebereitschaft voraussichtlich enorm steigert, wohingegen 
Appelle an die intrinsische Motivation meist zu aufwendig wären. Zudem ist es 
gerade für qualitative, biografische Interviews und bei Befragungen zu sensiblen 
Themen ausgesprochen förderlich innere Beweggründe zu wecken. Dies kann bei- 
spielsweise dadurch geschehen, dass den Befragten verdeutlich wird, dass ihre 
Teilnahme einen Einfluss auf konkrete Maßnahmen oder politische Prozesse ha- 
ben wird (vgl. Münch/Hauprich 2015). Vor allem in der Evaluations- und Begleit- 
forschung ist dies der Fall. Einige obdachlose Menschen fragen auch selbstständig 
nach der Möglichkeit einer Aufwandsentschädigung, da ihnen häufig bekannt 
ist, dass diese in anderen Kontexten zum wissenschaftlichen Standardprozede- 
re gehört. Die Interviewer:innen sollten daher in jedem Fall eine vertretbare Be- 
gründung haben, falls es keine Aufwandsentschädigungen gibt. Denn tatsächlich 
entstehen obdachlosen Menschen mit begrenzten Ressourcen durch die Zeitauf- 
wendung konkrete Nachteile, die es bei dieser Gruppe auszugleichen gilt. Entgegen 
der Vorstellung einer bürgerlichen Mehrheitsgesellschaft besteht die Obdachlosig- 
keit nämlich nicht aus einer Aneinanderreihung von Episoden des Müßiggangs, 
sondern Fleiß und Beharrlichkeit sind die notwendigen Grundvoraussetzungen 
zum Überleben auf der Straße (vgl. Hauprich 2019a). Beispielsweise müssen zwei 
Haupteinnahmequellen wie Betteln (vgl. Voss 1993) oder Pfandflaschensammeln 
(vgl. Moser 2014) als komplexe, handwerkliche Tätigkeiten verstanden werden, 
die nur unter exakter Zeitplanung funktionieren. Jahres- und Tageszeit sowie Bet- 
telort und -technik entscheiden darüber, ob die Einnahmen das Überleben auf der 
Straße sichern oder zum Entstehen einer Versorgungskrise führen. Zeitmanage- 
ment ist also für obdachlose Menschen existenziell. 

Häufig sind Sozialwissenschaftler:innen und Studierende gehemmt, obdach- 
losen Menschen monetäre Incentives anzubieten, in der Befürchtung, dass sich die- 
se anschließend Alkohol oder andere Rauschmittel davon kaufen. Dies ist jedoch 
erstens keine methodische, sondern eine forschungsethische Erwägung. Zweitens 
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kann versichert werden, dass obdachlose Menschen und insbesondere suchtkran- 
ke Personen auch ohne Incentives aus der Wissenschaft Suchmittel konsumieren 
werden und dass der Konsum von Substanzen nicht mit fehlenden Geldmitteln auf- 
hört. Drittens ist kritisch anzumerken, dass die empirische Sozialforschung auch 
in keinem anderen Befragungssegment paternalistische Überlegungen darüber an- 
stellt, was die Befragten mit ihren Aufwandsentschädigungen wohl tun könnten. 

Als willkommene Alternative zu Bargeldauszahlungen haben sich in Befragun- 
gen aufladbare Prepaid-Gutscheine von Lebensmittelketten und Discountern be- 
währt. Sie bieten den Vorteil, mit beliebigen Beträgen aufladbar zu sein und es den 
Befragungsteilnehmenden zu ermöglichen, selbstbestimmt und stigmabefreit alles 
kaufen zu können, was sie benötigen, angefangen bei Lebensmitteln und Hygiene- 
artikeln über Hundefutter bis hin zu Tabak oder Alkohol. Sollten forschungsöko- 
nomisch keine Mittel für die Vergabe von Incentives zur Verfügung stehen oder sie 
aus den oben benannten Gründen nicht erwünscht sein, hat es sich bewährt, zu- 
mindest die Zeit der Befragung und das Befragungssetting angenehm zu gestalten, 
sodass dies bereits einen Anreiz zur Teilnahme darstellt. Dies kann z.B. durch die 
Einladung zu einem Essen für ein qualitatives Interview oder die Bereitstellung von 
Kaffee, Snacks oder Zigaretten bei quantitativen Befragungen geschehen. 

Die Erfahrung zeigt, dass die meisten Rückläufe und auch die höchste Daten- 
qualität bei quantitativen Befragungen zur Straßenobdachlosigkeit das Resultat 
einer gelingenden Kombination sind aus gut bearbeitbaren Fragebögen mit inter- 
essanten Fragestellungen, einem angenehmen Befragungssetting, einer adäquaten 
Aufwandsentschädigung — und nicht zuletzt einem respektvollen und vertrauens- 
stiftenden Befragungsteam. Um diesen sozialwissenschaftlichen „Sweetspot“ zu 
finden, sind kritisch-reflektierte Pretests häufig förderlicher als langwierige theo- 
retisch-abstrakte Fragebogenkonstruktionen. 

Sich dem zu untersuchenden Feld hinreichend hinzugeben und als bescheide- 
ner Gast in fremde Lebenswelten „einzutauchen“, ist daher auch in vielen quanti- 
tativen Befragungen die wirklich erfolgsfördernde Komponente. Wer sich vor dem 
„Untersuchungsgegenstand“ scheut, kommt ihm nicht nah genug, um ihn exakt zu 
beschreiben. Hierin liegt die besondere Qualität von Sozialarbeiter:innen, die selbst 
Sozialarbeitsforschung betreiben, denn sie sind aufgrund ihrer Ausbildung und 
Arbeitspraxis in keinem gänzlich unvertrauten Feld, wenngleich es vielen — auch 
leider bedingt durch ihre Ausbildung, da empirische Sozialforschung im Grund- 
studium nur randständig behandelt wird — oft an ausreichend handwerklich-wis- 
senschaftlichem Arbeitsinstrumentarium fehlt. Hingegen hat ein Forschungsteam, 
dass Sozialwissenschaftler:innen, helfende Fachkräfte und (ehemals) Betroffene 
gleichermaßen einbindet, die besten Chancen auf differenzierte Forschungsergeb- 
nisse mit ausreichender Tiefenschärfe. Für quantitative Erhebungen gilt daher als 
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Empfehlung: Der Fragebogen sollte vor Beginn der Feldphase mindestens durch 
die Hände eines Forschenden, einer Sozialarbeiterin bzw. eines Sozialarbeiters 
und einer obdachlosen Person gegangen sein. 


Herausforderungen für qualitative Forschungsdesigns 


Auch die Frage, welche qualitativen Forschungsmethoden geeignet sind, um ob- 
dachlose Menschen zu befragen, lässt sich nur beantworten mit: alle qualitativen 
Methoden, die auch in Bezug auf andere Gruppen geeignet sind, um wissenschaft- 
lich auswertbare Daten zu erheben. Die Methodenauswahl sollte sich auch hier an 
der Fragestellung und dem möglichen Befragungssetting, sprich dem übergeord- 
neten Forschungsdesign, ausrichten und nicht ausschließlich an der Zielgruppe 
oder gewissen Annahmen über eine mangelnde Auskunftsfähigkeit. 

Gleichwohl gibt es durchaus qualitative Erhebungs- und Auswertungsmetho- 
den, die im Forschungskontext von Straßenobdachlosigkeit besondere Stärken auf- 
weisen, weil sie beispielsweise typische Fragestellungen gut bearbeitbar machen 
oder weil sie für die besonderen Settings und Rahmenbedingungen forschungs- 
ökonomisch besonders praktikabel sind. Exemplarisch sollen hier einige Anregun- 
gen gegeben werden, die an dieser Stelle zwar nicht in aller methodologischen 
Tiefe erörtert werden können, jedoch bereits erfolgreich in der Praxisforschung 
eingesetzt wurden und verdeutlichen, dass ein offener Umgang mit dem breiten 
Spektrum qualitativer Methoden Perspektiven eröffnen kann, die durch klassische 
qualitative Leitfadeninterviews verschlossen bleiben. 

Untersuchungen im Kontext von Obdachlosigkeit beschäftigen sich naturge- 
mäß häufig mit der Entkopplung der Betroffenen von Sozialräumen und der An- 
eignung von Orten. Ein Herausgelöst-Sein aus sozialen Räumen durch das Fehlen 
eines eigenen Zuhauses ist die zentrale Deprivation, der wohnungslose Menschen 
ausgesetzt sind. Die Stecknadelmethode ist eine qualitative Erhebungsmethode, 
die seit vielen Jahren bei Sozialraumanalysen in der Jugendforschung eingesetzt 
wird: 


„Die Nadelmethode ist eine ideale Einstiegsmethode einer Sozialraum- 
analyse, weil damit die Zielgruppen sehr niederschwellig angesprochen 
werden, d.h. ohne großen Aufwand lassen sich Kinder, Jugendliche und 
weitere Personen dazu motivieren, bestimmte Orte in einem Sozialraum 
zu kennzeichnen.“ (Deinet 2009 :72) 


Auch bei der Befragung obdachloser Menschen hat sich diese Methode aus ver- 
schiedenen Gründen beispielsweise bei der Rekonstruktion von Angsträumen 
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bereits bewähren können (vgl. Lukas/Hauprich 2022). Sie ist mit sehr geringem 
Aufwand durchführbar, da lediglich eine Karte und bunte Stecknadeln benötigt 
werden. Mittlerweile ist sie sogar über Tablets mit digitalen Karten noch flexibler 
einsetzbar. Die Nadelmethode hat den Vorzug, dass bereits im Prozess der Erhe- 
bung Ergebnisse optisch dargestellt und dabei mit den Befragten erörtert werden 
können, d.h., kommunikativ validierbar werden. Außerdem lässt dieses Verfah- 
ren sich nacheinander mit verschiedenen Teilnehmenden oder in Form einer Art 
Gruppendiskussion durchführen. Dabei werden die Karte und die entsprechenden 
Markierungen gemeinsam in einer Gruppe angefertigt und noch im Verlauf des 
Prozesses die Ergebnisse diskutiert. Über die Möglichkeiten der digitalen Hilfsmit- 
tel lassen sich heute sogar Interviewpassagen direkt an die Karte anheften, sodass 
die qualitativ Forschenden eine Art digitale Forschungskarte erhalten - sozusagen 
eine wachsende digitale Sozialraumanalyse. 

Eine weitere Methode, die eine ähnliche Idee verfolgt und mit der Nadelme- 
thode gut verknüpfbar ist, heißt „geführte Sozialraumanalyse“. Dabei handelt es 
sich um ein qualitatives Vorgehen, dass im Rahmen eines praktischen Forschungs- 
projekts zu den Angsträumen obdachloser Menschen (vgl. Hauprich/Lukas 2019; 
Lukas/Hauprich 2022) gemeinsam mit Studierenden der Sozialarbeit entstanden 
ist und daher in dieser Form bislang noch nicht methodologisch völlig entwickelt 
bzw. in der Literatur beschrieben wurde. Die Kernidee lässt sich auf das Konzept 
der Stadtführungen durch obdachlose Menschen zurückführen, die es mittler- 
weile in vielen deutschen Großstädten gibt. Bei diesen alternativen Stadtführun- 
gen werden von Straßenobdachlosigkeit Betroffene als Expert:innen der eigenen 
Lebenswelt zu Fremdenführer:innen, die eine Gruppe von Menschen durch ihre 
Heimatstadt führen und Plätze besuchen, die auf den ersten Blick keinen beson- 
deren touristischen Wert haben, jedoch in der Lebenswelt bestimmter marginali- 
sierter Gruppen entscheidende Rollen spielen. Beispielsweise führen suchtkranke 
Menschen durch die Hauptbahnhöfe und schildern dort, welche Sozialräume und 
Regeln des Feldes für Menschen verschlossen bleiben, die mit stoffgebundenen 
Süchten keine Berührung haben: Wo können welche Drogen gekauft werden? Wie 
werden sie konsumiert und wie wirken sie? Welche Probleme verursachen sie und 
was bedeutet dies für Suchtkranke? Wo kann konsumiert werden und wo gibt es 
Vertreibungsmethoden der Mehrheitsgesellschaft? Was ist ein Druckraum und wa- 
rum ist er für Suchtkranke lebenswichtig? Letztendlich handelt es sich dabei auch 
um eine Sozialraumanalyse, die in dieser besonderen Form aber von „experts by 
experience“ angeleitet wird. Setzt man diese Stadtführungen als wissenschaftliche 
Methode ein, besteht die handwerkliche Herausforderung darin, quasi im Vorbei- 
gehen geeignete Dokumentations- und Erhebungstechniken anzuwenden (Audio- 
aufnahmen, Feldnotizen, Bilddokumentationen u.Ä.). Herausfordernd ist dies 
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deshalb, weil ein zu hoher technischer Aufwand schnell den immersiven Charakter 
und die Natürlichkeit der episodischen Erzählungen der Fremdenführer:innen stö- 
ren kann. Eine Variante dieser Methode kann deshalb die Arbeit mit Autofotografie 
darstellen (vgl. Dirksmeier 2013). Dies bedeutet, dass die betroffenen Personen 
eigenständig bedeutsame Orte und Sozialräume aufsuchen, dort Fotos anfertigen 
und sodann versuchen, bedeutsame Strukturen und Stimmungen einzufangen, die 
in einem anschließenden qualitativen Interview als Erzählstimuli eingesetzt wer- 
den können. 


Herausfordernde Interviewsettings und Zielgruppenspezifika 


Wie oben dargestellt, handelt es sich bei obdachlosen Personen um keine grund- 
sätzlich anderen Menschen, sodass auch die üblichen sozialwissenschaftlichen 
Methoden genutzt werden können, um Daten zu erheben und Feldzugänge her- 
zustellen. Obdachlosigkeit muss jedoch auch als multikomplexes Armutsphäno- 
men begriffen werden, das spezifische Prädiktoren hat und auch zu bestimmten 
Deprivationen bei den Betroffenen führt. Kurzum: Die Gruppe der obdachlosen 
Menschen als Ganzes weist durchaus bestimmte Spezifika auf, die bei einer wissen- 
schaftlichen Erhebung bedacht werden sollten, da bestimmte soziale Problemlagen 
hier überproportional stark vertreten sind. Diese abschließend zu benennen und in 
aller Komplexität und im Hinblick auf ihre Implikationen für ein Forschungsdesign 
zu beschreiben, kann im vorliegenden Rahmen nicht geleistet werden. Jedoch sol- 
len zwei dieser Herausforderungen für eine quantitative und eine qualitative Er- 
hebung exemplarisch skizziert werden: 

Niedrige formale Schulbildung ist ein zentraler Prädiktor für Armut und Des- 
integration vom ersten Arbeits- und Wohnungsmarkt. Wer in prekären Beschäf- 
tigungsverhältnissen arbeiten muss gerät schneller in Wohnungsnot und hat ein 
erhöhtes Risiko obdachlos zu werden. Im Umkehrschluss findet sich in der Gruppe 
der von Obdachlosigkeit betroffenen Menschen eine überproportional hohe An- 
zahl von Personen, die unter funktionalem Analphabetismus leiden. Darüber hin- 
aus besteht eine der größten Subgruppen obdachloser Menschen in Deutschland 
derzeit aus Personen, die aus den neuen EU-Ländern wie Rumänien und Bulgarien 
stammen und im Zuge der EU-Osterweiterung nach Deutschland gekommen sind, 
hier keine Arbeit finden und - sofern sie keinen Platz auf dem grauen Wohnungs- 
markt finden — obdachlos werden und verelenden (vgl. Matter 2015; Münch/Hau- 
prich 2015). Außerdem sind viele obdachlose Menschen nicht krankenversichert 
und daher nicht in der Lage, sich eine Sehhilfe anzuschaffen. Daraus ergibt sich in 
der Summe, dass viele obdachlose Menschen bei quantitativen Erhebungen Hilfe 
beim Ausfüllen der Fragebögen benötigen — entweder weil sie in ihren Lese- und 
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Schreibfähigkeiten eingeschränkt sind oder aber der Fragebogen nicht in ihrer 
Muttersprache vorliegt oder — ganz pragmatisch — sie die Buchstaben ohne Seh- 
hilfe nicht entziffern können. Intellektuell wären die allermeisten obdachlosen 
Menschen ohne Weiteres in der Lage, auch komplexere Fragebögen auszufüllen, 
werden aber aufgrund der beschriebenen Umstände schlicht daran gehindert, die- 
ses Forschungsinstrument zu bedienen. Als Lösungsansatz haben sich Fragebögen 
mit großer Schrift, in einfacher Sprache und die Möglichkeit zur Inanspruchnahme 
von Assistenzen (Paper-Assisted-Personal-Interviews) bewährt. Dass Forschende 
beim Ausfüllen der Fragebögen Hilfe anbieten, wird bei Forschungsdesigns häufig 
viel zu schnell verworfen, da es schließlich um sensible Themen ginge. Nicht selten 
steht jedoch auch ein gewisses Unbehagen bei Wissenschaftler:innen im Raum, mit 
einer Lebenswelt in Kontakt zu kommen, die ihnen fremd ist oder sie ängstigt. 

Bei qualitativen Interviews kommt oft ein anderes methodisch oder metho- 
dologisches Problem zum Tragen, das mit dem Gesundheitszustand obdachloser 
Menschen zu tun hat: Seelische Erkrankungen und Sucht sind in der Obdachlosig- 
keit weit verbreitete Probleme (vgl. Fichter et al. 1997, 2000; Bäuml et al. 2017). 
Dies hat zum einen den Hintergrund, dass beispielsweise psychiatrische Erkran- 
kungen zu Arbeits- und Wohnungsverlust führen können. Umgekehrt jedoch wir- 
ken sich die Rahmenbedingungen von Obdachlosigkeit ebenfalls schwerwiegend 
auf den seelischen Gesundheitszustand der Betroffenen aus. Gleiches gilt für den 
Suchtmittelkonsum: Er kann Ursache von Wohnungsnotfällen sein, wird in der Ob- 
dachlosigkeit jedoch auch zusätzlich verstärkt. Eine unidirektionale Zuschreibung, 
dass obdachlose Menschen vor allem psychisch krank seien, ist so unzutreffend 
wie gefährlich (vgl. von Treuberg 1990; BAG W 2008). Dieser Diskurs wird daher 
in der Wohnungslosenhilfe zu Recht sehr sensibel geführt. Es muss jedoch nicht 
bewertend zur Kenntnis genommen werden, dass sich in der Gruppe der obdachlo- 
sen Menschen überproportional viele seelisch Kranke und suchtkranke Menschen 
finden lassen: Wer Obdachlosigkeit beforscht, hat auch immer wieder mit psych- 
iatrischen Erkrankungen und stoffgebundenen Süchten zu tun. Bei der Erhebung 
und Auswertung von qualitativen Daten stellt dies die Befragenden nicht selten vor 
Herausforderungen. Während qualitativen Interviews kann es dazu kommen, dass 
die psychiatrischen Symptome der Interviewpartner:innen sehr augenscheinlich 
werden. Ein Interview mit einem obdachlosen Menschen, der unter einer akuten 
Psychose leidet, ist handwerklich hoch anspruchsvoll. Zudem stellt sich die metho- 
dologische wie forschungsethische Frage, welche Anteile des Interviewmaterials 
genutzt werden können, sollen, müssen oder dürfen. Die meisten Interviewme- 
thoden der empirischen Sozialforschung sind für Menschen ohne seelische Er- 
krankungen konzipiert und setzen die Möglichkeit höherer Abstraktionsleistungen 
voraus. Aber auch bei Methoden wie dem episodischen Interview (vgl. Flick 1996), 
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welches die Möglichkeit eröffnet, über Alltagserzählungen subjektive Sinnzusam- 
menhänge zu rekonstruieren, kann es zu Schwierigkeiten kommen, beispielsweise 
dann, wenn der:die Interviewende im Gespräch zu verstehen beginnt, dass sein 
Gegenüber aufgrund einer suchtinduzierten neurologischen Erkrankung konfabu- 
liert, d.h., nicht erinnerbare Anteile der Erfahrung mit „erfundenen“ Anteilen füllt. 
Es muss auch forschungsethisch geklärt sein, wann ein Nachfragen zu beenden ist, 
da eine provozierte Auseinandersetzung mit kritischen Lebensereignissen auch Re- 
traumatisierungen auslösen kann. Auch wenn Sucht eine Rolle spielt, stellen qua- 
litative Interviews hohe Anforderungen an die kommunikativen Fähigkeiten der 
Befragenden. Nicht selten sind Menschen, die an stoffgebundenen Suchterkran- 
kungen leiden derart stark intoxikiert, dass sie sich nur schwer fokussieren können 
oder auch schlicht während des Gesprächs einschlafen. Auch hier hat es sich be- 
währt, Expert:innen wie ehemals Betroffene oder sozialarbeiterische Fachkräfte in 
die Gespräche miteinzubinden, um eine gelingende Kommunikation herzustellen 
oder aber im Nachgang zu eruieren, welche Anteile des Interviews ggf. nicht zur 
direkten Auswertung geeignet oder freigegeben sind. 

Die oben angeführten Beispiele stellen bei weitem nicht den Regelfall dar. Je- 
doch beruhen sie alle auf tatsächlichen Felderfahrungen empirischer Forschungs- 
projekte (siehe Hauprich 2021; Lukas/Hauprich 2022; Münch/Hauprich 2015; 
Hauprich 2019b). Auch hier gilt die Empfehlung, sich weniger im Vorfeld bereits 
mit hochkomplexen methodologischen Überlegungen aufzuhalten, sondern ganz 
pragmatisch verschiedene Erhebungsmethoden im Feld zu erproben, um sodann 
auf der Grundlage dieser Erfahrungen ein praxistaugliches Forschungsdesign zu 
entwerfen, dass geeignet ist, auswertbare Daten zu erheben und forschungsethi- 
sche Grundprinzipien einzuhalten 


Fazit und Schlussbemerkung 


Obdachlose Menschen können grundsätzlich wie jede andere soziale Gruppe für 
sozialwissenschaftliche Erhebungen gewonnen werden, selbstständig an einer 
solchen teilnehmen und sind in gleichem Maße auskunftsfähig wie Mitglieder der 
Mehrheitsgesellschaft. Eine stellvertretende Teilnahme an einer Untersuchung 
durch Sozialarbeiter:innen ist weder zwingend notwendig noch in jedem Fall rat- 
sam, da sie auch die Gefahr einer Generierung wissenschaftlicher Artefakte birgt. 
Validere und reliablere Daten werden durch die Befragung der tatsächlich Betroffe- 
nen gewonnen, die letztlich Expert:innen ihrer eigenen Lebenswelt sind. 

Da Menschen, die von Straßenobdachlosigkeit betroffen sind, in besonde- 
ren Lebensverhältnissen leben, die mit sozialen Schwierigkeiten verbunden sind, 
kann es allerdings notwendig sein, die gängigen quantitativen und qualitativen 
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Methoden der Datenerhebung und -auswertung sorgfältig und einfühlsam an 
die Rahmenbedingungen dieser Lebensverhältnisse anzupassen. Hierbei können 
Sozialarbeiter:innen durchaus als mit dem Feld vertraute Personen wertvolle In- 
formationen und Hinweise liefern und Zugänge zur Zielgruppe etablieren sowie 
Vertrauen in die Befragung herstellen. Auch (ehemals) obdachlose Menschen kön- 
nen als Interviewende und Vermittler:innen fungieren. 

Die praktische wissenschaftliche Forschung im Feld der Straßenobdachlosig- 
keit ist erfahrungsgemäß weniger von theoretischen Methodendiskursen abhän- 
gig, sondern profitiert eher von einer fehlerfreudigen und kritischen Erprobung 
der Forschungsinstrumente im tatsächlichen Feld. Der Erfolg einer Obdachlosig- 
keitsuntersuchung hängt dabei maßgeblich von der Fähigkeit der Wissenschaft- 
ler:innen ab, mit widrigen Umständen umzugehen und die Daten retrospektiv im 
Hinblick auf mögliche verzerrende Effekte kritisch zu beleuchten. Diese widrigen 
Umstände können sich auf die Rahmenbedingungen des Erhebungssettings be- 
ziehen. Sie können aber auch in sozialen Problemen und Deprivationen liegen, 
denen obdachlose Menschen entweder ausgesetzt sind oder die sie in die Notlage 
selbst geführt haben. Um dennoch ausreichend Datenmaterial mit einem möglichst 
hohen Aussagegehalt zu generieren, ist es notwendig, die gängigen quantitativen 
und qualitativen Auswertungs- und Erhebungsmethoden in einer Weise anzu- 
passen, die sie in diesem Feld anwendbar werden lässt, ohne zugleich mit den 
zentralen methodologischen Prämissen der einzelnen Instrumente zu brechen. 
Wissenschaftler:innen, die es verstehen, sich auf dieses besondere Feld einzulas- 
sen, mit dem erlernten Handwerkszeug sicher, aber auch unkonventionell umzu- 
gehen, und gegebenenfalls sogar zulassen können, mehrere Methoden ineinander 
zu verschränken, können jedoch sehr sicher sein, spannende Daten zu erhalten. 
Sie gewinnen unmittelbare Einblicke in eine soziale Lebenswelt, die den wissen- 
schaftlichen Erkenntnisstand im Segment Armut und Ausgrenzung — aber auch 
das eigene, persönliche sozialwissenschaftliche Verständnis — um eine bedeutende 
Dimension erweitert. 
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I. Einführung! 


Die Erhebung und Verarbeitung umfassender Datensätze, insbesondere die Nut- 
zung von Daten für die Analyse verschiedener Fragestellungen und Plausibilität 
von Ergebnissen, sind für die empirische Sozialforschung und bildungswissen- 
schaftliche Forschung essenziell. 

Die Verarbeitung personenbezogener Daten zu wissenschaftlichen For- 
schungszwecken steht dabei vielfach in einem Spannungsverhältnis zu daten- 
schutzrechtlichen Grundsätzen (vgl. Roßnagel ZD 2019: 157 und Golla, in Specht/ 
Mantz 2019: 8 23, Rn. 7) wie u.a. der Zweckbindung, der Datenminimierung so- 
wie der Speicherbegrenzung, auch wenn die Datenschutz-Grundverordnung (im 
Folgenden DS-GVO) der Forschung zahlreiche Privilegien einräumt. Dabei gehen 
die Zwecke des Datenschutzrechts und die Ziele der Bildung und Lehre gleichzeitig 
miteinander einher, denn zentral sind der Schutz und die Entwicklung der Persön- 
lichkeit (vgl. Golla, in Specht/Mantz 2019: 8 23 Rn. 75) als Ausdruck der informa- 
tionellen Selbstbestimmung. 

Im Forschungskontext sind für die Verarbeitung von Gesundheits- und Sozial- 
daten umfassende datenschutzrechtliche Vorgaben eines komplexen datenschutz- 
rechtlichen Regelungsregimes zu beachten, die für Studierende und Forschende 
nur selten umfänglich zu überschauen sind (vgl. March et al. 2015: 3). Neben 
der DS-GVO stehen weitere bereichsspezifische Datenschutzgesetze, die auf un- 
terschiedlichen Regulierungsebenen angesiedelt sind, sodass in der Gesamtbe- 
trachtung der Überblick an anwendbaren Regelungen erschwert wird. Für die 
Schul- und Unterrichtsforschung beispielsweise gelten unterschiedliche Schulge- 
setze und Schulordnungen der Länder. Übereinstimmend gilt, dass datenschutz- 


1 [Der vorliegende Informationstext dient der Orientierung und ersetzt nicht die Beratung 
durch eine:n Datenschutzbeauftragt:en.]. Aufgrund des in der Datenschutz-Grundver- 
ordnung verwendeten Wortlauts wird zur besseren Lesbarkeit und Verständnis auf die 
gendergerechte Sprache verzichtet. Die in diesem Beitrag verwendeten Personenbezeich- 
nungen beziehen sich immer gleichermaßen auf alle Geschlechter. 


187 


5 Datenschutz in der empirischen (Sozial-)Forschung 


rechtliche Bestimmungen beachtet werden müssen, sobald Daten erhoben und 
verarbeitet werden. 

Ziel des Beitrags ist es, Studierenden sowie allen Interessierten und Forschen- 
den aus den Sozialwissenschaften und bildungswissenschaftlich angesiedelten 
Studiengängen, Erziehungswissenschaften und Lehramt, die relevanten Regelun- 
gen und Anforderungen des Datenschutzes näherzubringen und dabei praktische 
„Datenkompetenzen“ zu vermitteln. 

Spezifischer widmet sich die Abhandlung den wesentlichen Grundbegriffen 
des Datenschutzes, u.a. dem Begriff der personenbezogenen Daten sowie den Be- 
griffen der Pseudonymisierung und Anonymisierung. Darüber hinaus werden die 
Grundsätze nach der DS-GVO, die Pflichten des Datenverarbeiters, insbesondere 
die Ausgestaltung von Informationspflichten sowie die anwendbaren Regelungen 
der DS-GVO, exemplarisch beleuchtet. Vereinzelt werden die anwendbaren Rege- 
lungen im Sozialbereich/Schulbereich aufgrund des begrenzten Umfangs der Ab- 
handlung angerissen. In diesem Zusammenhang soll eine „Kontrollliste“ erarbeitet 
werden, die die grundlegenden Fragen bzw. Voraussetzungen der datenschutz- 
rechtlichen Anforderungen für Verantwortliche einer Datenverarbeitung enthält. 
Da die Datenverarbeitung im Rahmen der Sozialforschung und der bildungswis- 
senschaftlichen Forschung jedoch vielseitig ausgestaltet ist, werden die dargeleg- 
ten Grundlagen und Fragestellungen nicht jedes Detail berücksichtigen können. 
Eine weitere Auseinandersetzung mit dem jeweiligen Einzelfall durch Forschende 
selbst (gegebenenfalls durch Hinzuziehung eines bzw. einer Datenschutzbeauf- 
tragten) ist erforderlich. 


Il. Anwendungsbereich der DS-GVO 


Wenn personenbezogene Daten verarbeitet werden, findet die DS-GVO Anwen- 
dung. Die DS-GVO gilt als Verordnung seit dem 25. Mai 2018 unmittelbar in 
allen Mitgliedstaaten der Europäischen Union und hat aufgrund dessen Anwen- 
dungsvorrang gegenüber dem nationalen Recht (vgl. Weichert 2022: 27). Die Ver- 
ordnung umfasst ein Nebeneinander von allgemeinen und bereichsspezifischen 
Datenschutzregelungen (vgl. Buchner, in Tinnefeld/Buchner/Petri/Hof 2019: 
219). Zahlreiche bereichsspezifische Öffnungsklauseln bestimmen, dass die Mit- 
gliedstaaten nationale Regelungen erlassen können, die den Datenschutz in Ein- 
klang mit der Verordnung abgestufter regeln, um nationalen Besonderheiten z.B. 
in der empirischen Forschung (Sozialdatenschutz) angemessen Rechnung zu tra- 
gen (vgl. Kipker/Pollmann, in Specht/Mantz 2019: § 26, Rn. 7, 8.). Diese bereichs- 
spezifischen Regelungen haben sodann wiederum Vorrang vor der Anwendung der 
DS-GVO (vgl. Roßnagel ZD 2019: 157 f.). 
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Gemäß Art. 2 DS-GVO ist der sachliche Anwendungsbereich der Verordnung 
eröffnet, wenn eine ganz oder teilweise automatisierte Verarbeitung personenbe- 
zogener Daten erfolgt. 


1 Personenbezogene Daten 


Die Anwendbarkeit des Datenschutzrechts setzt das Vorliegen personenbezogener 
Daten voraus. Personenbezogene Daten sind gemäß Art. 4 Nr. 1 DS-GVO „alle In- 
formationen, die sich auf eine identifizierte oder identifizierbare natürliche“, so- 
genannte „betroffene“ Person beziehen. Eine Person ist gemäß Art. 4 Nr. 1 DS-GVO 
identifizierbar, wenn sie direkt oder indirekt, insbesondere mittels Zuordnung zu 
einer Kennung (Namen, Kennnummer etc.) oder anderen besonderen Merkmalen, 
wozu physische, physiologische, genetische, psychische und soziale Merkmale ge- 
hören können, identifiziert werden kann. Davon umfasst sind ebenso Informatio- 
nen über wirtschaftliche oder berufliche Verhältnisse sowie Werturteile über eine 
Person, wie eine Einstufung als „zuverlässig“ oder „kreditwürdig“ bis hin zu falsch 
verbreiteten Informationen über die betroffene Person (vgl. Klabunde, in Ehmann/ 
Selmayr 2018: Art. 4, Rn. 9 und Buchner, in Tinnefeld/Buchner/Petri/Hof 2019: 
222 f.). Sofern sich ein Informationsgehalt unmittelbar auf die persönlichen oder 
sachlichen Verhältnisse einer Person bezieht oder mit einer Person in Verbindung 
gebracht werden kann (sich z.B. von allen Mitgliedern einer Personengruppe un- 
terscheiden lässt), ist ein Personenbezug von Daten anzunehmen (vgl. Buchner, in 
Tinnefeld/Buchner/Petri/Hof 2019: 223 und Gola, in Gola 2022: Art. 4, Rn. 8). 
Der Begriff der personenbezogenen Daten ist folglich weit zu verstehen (vgl. Ernst, 
in Paal/Pauly 2021: Art4, Rn. 3). Die Möglichkeit die Identität einer Person grund- 
sätzlich festzustellen, reicht aus datenschutzrechtlicher Sicht aus, um diese als 
„bestimmbar“ bzw. „identifizierbar“ einzustufen. Zur Beurteilung der Identifizier- 
barkeit einer natürlichen Person sind alle Mittel zu berücksichtigen, die von dem 
Verantwortlichen nach allgemeinem Ermessen wahrscheinlich genutzt werden 
(Kosten, Zeitaufwand, Technologie), um eine natürliche Person zu identifizieren 
(vgl. Schild, in BeckOK 2021: Art. 4, Rn. 15). 

Die DS-GVO unterscheidet „einfache“ personenbezogene Daten von „beson- 
deren“ Kategorien personenbezogener Daten. Dabei werden an die Verarbeitung 
dieser Daten unterschiedliche Anforderungen geknüpft (vgl. Kipker/Pollmann, in 
Specht/Mantz 2019: 8 26, Rn. 21). 

Bei der Verarbeitung „einfacher“ personenbezogener Daten, worunter u.a. der 
Name, die Adresse, das Geburtsdatum, Kontodaten aber auch die IP-Adresse fallen, 
muss eine der Legitimationstatbestände aus Art. 6 lit. a bis f DS-GVO gegeben sein. 


189 


5 Datenschutz in der empirischen (Sozial-)Forschung 


Bei der Datenverarbeitung in der Sozialforschung sowie auch in der bil- 
dungswissenschaftlichen Forschung ist im Besonderen zu beachten, dass die 
Datenverarbeitung nicht selten auf die Verarbeitung von besonderen Kategorien 
personenbezogener Daten abzielt, wozu gemäß Art. 9 Abs. 1 DS-GVO nicht nur 
Gesundheits- und Sozialdaten, sondern auch Daten, aus denen sich die Herkunft, 
politische Meinung sowie religiöse und weltanschauliche Überzeugungen (z.B. 
Religionszugehörigkeit) ableiten lassen, zu zählen sind. Diese Daten sind entspre- 
chend ihrem Namen besonders schützenswert und bei der Verarbeitung sind stren- 
gere Anforderungen innerhalb des Art. 9 Abs. 2 lit. a bis j DS-GVO zu beachten als 
bei der Verarbeitung „einfacher“ Kategorien. 


2 Datenverarbeitung 


Die Anwendbarkeit der DS-GVO setzt als weitere Tatbestandsvoraussetzung vor- 
aus, dass personenbezogene Daten „verarbeitet“ werden. Das Datenschutzrecht 
regelt die Verarbeitung personenbezogener Daten ab dem Zeitpunkt der Erhebung 
für alle Phasen (Speicherung, Veränderung, Löschung) und weiteren Nutzung 
(vgl. Buchner, in Tinnefeld/Buchner/Petri/Hof 2019: 231 und Ernst, in Paal/Pauly 
2021: Art 4, Rn. 21-35 und Klabunde, in Ehmann/Selmayr 2018: Art 4, Rn. 23, 
24). 

Unter einer Verarbeitung versteht die DS-GVO gemäß Art. 4 Nr. 2 DS-GVO jede 
Handlung im Zusammenhang mit personenbezogenen Daten, namentlich Verän- 
dern, Speichern, Übermitteln, Erheben, Löschen, Verknüpfen. Auf den Umfang 
oder die Dauer der Verarbeitung kommt es nicht an. Der Verordnung liegt somit 
auch hierfür ein weites Begriffsverständnis zugrunde (vgl. Ernst, in Paal/Pauly 
2021: Art. 4, Rn. 20 und Buchner, in Tinnefeld/Buchner/Petri/Hof 2019: 231). 


3 Datenschutzrechtliche Verantwortlichkeit 


Werden personenbezogene Daten verarbeitet, ist sodann zu klären, wer diese Ver- 
arbeitung zu verantworten hat, gegebenenfalls auch selbst durchführt und somit 
Adressat der datenschutzrechtlichen Bestimmungen ist. 

Ein Verantwortlicher wird in Art. 4 Nr. 7 DS-GVO definiert als „jede natür- 
liche oder juristische Person, Behörde, Einrichtung oder andere Stelle, die allein 
oder gemeinsam mit anderen über die Zwecke und Mittel der Verarbeitung von 
personenbezogenen Daten entscheidet“. Eine Prüfung der Verantwortlichkeit 
kann in drei Schritten erfolgen: (1) Prüfung der Eigenschaft der potenziell verant- 
wortlichen Stelle (natürliche oder juristische Person, Behörde, Einrichtung oder 
andere Stelle), (2) Prüfung einer alleinigen oder gemeinsamen (weitere Akteure) 
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Entscheidungsbefugnis (Differenzierung der alleinigen und gemeinsamen Ver- 
antwortlichkeit), (3) Prüfung der grundsätzlichen Entscheidungsbefugnis über 
die Zwecke und Mittel (vgl. Hartung, in Kühling/Buchner 2020: Art. 4 Nr. 7 Rn. 8 
und Artikel-29-Datenschutzgruppe 2010: 10). In diesem Zusammenhang muss 
geprüft werden, ob eine Behörde oder ein Unternehmen die personenbezogenen 
Daten durch eine Einzelperson (natürliche Person) verarbeiten lässt, beispielswei- 
se im Rahmen einer Studie. Im letztgenannten Fall wäre nicht die Einzelperson 
Verantwortliche im Sinne der DS-GVO, sondern die dahinterstehende Stelle — das 
gilt auch, wenn der Einzelperson die Verantwortung für das Projekt oder die Stu- 
die zugewiesen wird (vgl. Buchner, in Tinnefeld/Buchner/Petri/Hof 2019: 232 
und Raschauer, in Sydow 2022: Art. 4, Rn. 125 und Hartung, in Kühling/Buchner 
2019: Art. 4, Rn. 9). 


4 Forschung in der DS-GVO 


Für die wissenschaftliche Forschung sieht die DS-GVO Privilegien, basierend 
auf der Forschungsfreiheit nach Art. 13 Grundrechte Charta, vor. Diese ergeben 
sich aus den Datenschutzgrundsätzen und sollen die Verarbeitung von personen- 
bezogenen Daten einerseits erleichtern, andererseits aber ebenso Garantien für die 
Rechte und Freiheiten der betroffenen Personen als Ausgleich für die gewährten 
Erleichterungen schaffen (vgl. Roßnagel ZD 2019: 157 ff.). Eine Legaldefinition 
für den Begriff der Forschung liegt der Verordnung nicht zugrunde (vgl. Golla, 
in Specht/Mantz 2019: § 23, Rn. 14). Die in der DS-GVO eingeräumte Privilegie- 
rung gilt dabei grundsätzlich nur für die unabhängige, nicht kommerziell ausge- 
richtete Forschung (vgl. Weichert, in Kühling/Buchner 2019: Art. 9, Rn. 129,130 
und Weichert ZD 2020: 18). Der Begriff ist weit zu verstehen und setzt eine Ver- 
arbeitung mit dem Ziel der Gewinnung neuartiger Erkenntnisse voraus. Unter die 
Privilegierung fällt im Einzelfall auch die Markt- und Meinungsforschung, sofern 
die Analyse durch ein unabhängiges Forschungsinstitut durchgeführt wird und 
auf die Generierung neuer Erkenntnisse ausgerichtet ist, also nicht lediglich neue 
Informationen unter der Anwendung bekannter Methoden erforscht werden (vgl. 
Golla, in Specht/Mantz 2019: 8 23, Rn. 15, differenzierend dazu Schlösser-Rost, 
in BeckOK 2022: 8 27, Rn. 19 und Roßnagel ZD 2019: 159 sowie Hornung/Hoff- 
mann ZD 2017: 4). Auch statistische Datenverarbeitungen, die Daten nach wissen- 
schaftlicher Methode zur Gewinnung neuartiger Erkenntnisse verarbeiten, können 
darunterfallen (vgl. Golla, in Specht/Mantz 2019: § 23, Rn. 18 und Johannes/ 
Richter DuD 2017: 300, 301). Davon begrifflich losgelöst zu betrachten ist die wis- 
senschaftliche Lehre, die keine ausdrückliche Privilegierung in der DS-GVO findet 
(vgl. Golla, in Specht/Mantz 2019: 8 23 Rn. 77). 
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lll. Verarbeitungsgrundsätze für den Umgang mit 
personenbezogenen Daten im Kontext der 
wissenschaftlichen Forschung 


Die DS-GVO normiert zentrale Prinzipien, die jeder Verantwortliche bei der Ver- 
arbeitung von personenbezogenen Daten beachten und gemäß Art. 5 Abs. 2 DS- 
GVO einhalten und nachweisen muss. 


1 Verbotsprinzip (mit Erlaubnisvorbehalt) 


Das „Verbotsprinzip mit Erlaubnisvorbehalt“ ist der zentralste Grundsatz der Ver- 
ordnung und Ausgangspunkt einer jeden datenschutzrechtlichen Betrachtung. 
Damit wird der Devise Folge geleistet, dass die betroffene Person grundsätzlich 
selbst über die Preisgabe und über die Verwendung ihrer persönlichen Daten be- 
stimmen soll. Nach diesem Grundsatz ist jede Verarbeitung personenbezogener 
Daten grundsätzlich untersagt, es sei denn, eine in der Verordnung etablierte 
Legitimationsgrundlage ermöglicht die Verarbeitung. Die datenschutzrechtliche 
Einwilligung und die gesetzlichen Erlaubnistatbestände sind dabei in Erwägung 
zu ziehen und stehen grundsätzlich gleichrangig nebeneinander (vgl. Frenzel, in 
Paal/Pauly 2021: Art. 6, Rn. 1). Für die Verarbeitung besonderer Kategorien per- 
sonenbezogener Daten kommt generell die Einwilligung gemäß Art. 9 Abs. 2 lit. a 
DS-GVO in Betracht. Daneben sind für die wissenschaftliche Forschung und für die 
Versorgung oder Behandlung sowie Verwaltung im Sozialbereich die Art. 9 Abs. 2 
lit. h und j DS-GVO einschlägig und stellen eine Ausnahme vom Verbotsprinzip dar 
(vgl. Weichert, in Kühling/Buchner 2019: Art. 9, Rn. 126). 


2 Rechtmäßigkeit, Verarbeitung nach Treu und Glauben, Transparenz 


Die Verordnung legt fest, dass personenbezogene Daten „auf rechtmäßige Weise, 
nach Treu und Glauben und in einer für die betroffene Person nachvollziehbaren 
Weise“ verarbeitet werden müssen. Demnach bedarf es für die Verarbeitung per- 
sonenbezogener Daten einer rechtmäßigen Grundlage, die innerhalb der Ver- 
ordnung entweder auf einer Einwilligung einer betroffenen Person oder auf einer 
anderweitigen Rechtsgrundlage basiert. Der Grundsatz der Verarbeitung nach 
Treu und Glauben greift als Auffangtatbestand für Datenverarbeitungen, die trotz 
Wahrung aller datenschutzrechtlichen Vorgaben für die betroffene Person eine 
„unbillige Härte“ darstellen (vgl. Herbst, in Kühling/Buchner 2020: Art. 5, Rn.17 
und Buchner, in Tinnefeld/Buchner/Petri/Hof 2019: 237). 
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Daneben bestimmt der Transparenzgrundsatz, dass der betroffenen Person 
zum Zeitpunkt der Datenerhebung Informationen zur Verfügung zu stellen sind, die 
die konkrete Datenverarbeitung nachvollziehbar und leicht verständlich beschrei- 
ben (sogenannte Datenschutzinformation oder auch -erklärung) (vgl. Schantz, in 
BeckOK 2020: Art. 5, Rn. 11). Dabei umfasst der Transparenzgrundsatz zum einen 
die transparente Darlegung einer Datenverarbeitung und zum anderen die trans- 
parente Ausgestaltung einer Einwilligungserklärung (vgl. Heberlein in Ehmann/ 
Selmayr 2018: Art. 5, Rn. 11). Eine heimliche Datenverarbeitung, ohne die Kennt- 
nis der betroffenen Person, soll damit ausgeschlossen werden (vgl. Buchner, in Tin- 
nefeld/Buchner/Petri/Hof 2019: 237). 


3  Zweckbindung 


Der Zweckbindungsgrundsatz stellt ein weiteres datenschutzrechtliches Verarbei- 
tungsprinzip dar, welches insbesondere eine Datenverarbeitung auf Vorrat verhin- 
dern soll (vgl. Heberlein, in Ehmann/Selmayr 2018: Art. 5, Rn. 25 und Buchner, 
in Tinnefeld/Buchner/Petri/Hof 2019: 237). Demnach dürfen personenbezogene 
Daten nur „für festgelegte, eindeutige und legitime Zwecke erhoben“ und gemäß 
Art. 5 Abs. 1 lit. b DS-GVO nicht in einer Weise verarbeitet werden, die mit diesen 
Zwecken unvereinbar ist. Das Prinzip der Zweckbestimmtheit und Zweckbindung 
erstreckt sich über alle Phasen einer Datenverarbeitung, also von der Erhebung, 
der Tätigkeit der Verarbeitung bis hin zur Löschung (vgl. Pötters, in Gola 2022: 
Art. 5, Rn. 17 und Buchner, in Tinnefeld/Buchner/Petri/Hof 2019: 237). Dabei 
muss die Zweckbestimmung zum Zeitpunkt der Datenerhebung so präzise wie 
möglich erfolgen und auch gegenüber der betroffenen Person kommuniziert wer- 
den. Für wissenschaftliche Forschungszwecke ist der Zweckbindungsgrundsatz et- 
was aufgelockert (siehe Broad Consent) und unter gewissen Voraussetzungen eine 
nachträgliche Zweckänderung zulässig. Dies stellt eine der elementarsten Privi- 
legierungen der Forschung durch die DSGVO dar (vgl. Herbst, in Kühling/Buchner 
2020: Art. 5, Rn. 50). Dabei muss eine Weiterverarbeitung zwingend den geeigne- 
ten Garantien des Art. 89 Abs. 1 DS-GVO unterliegen. 


4 Datenminimierung 


Nach dem Grundsatz der Datenminimierung darf sich die Datenerhebung nur auf 
das für die Verarbeitung erforderliche Maß beschränken. Dabei ist darauf hinzu- 
wirken, dass keine (sogenannte Datenvermeidung) oder so wenig personenbezo- 
gene Daten wie möglich und so viele wie nötig (sogenannte Datensparsamkeit) 
verarbeitet werden (vgl. Buchner, in Tinnefeld/Buchner/Petri/Hof 2019: 240). 
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Nach Art. 5 Abs. 1 lit. c DS-GVO müssen personenbezogene Daten „dem Zweck an- 
gemessen und erheblich sowie auf das für die Zwecke der Verarbeitung notwendige 
Maß beschränkt sein“. Dies kann daran gemessen werden, ob die Aufgabe des Ver- 
antwortlichen ohne die Datenverarbeitung nicht, nicht rechtzeitig, nicht vollstän- 
dig oder nur mit einem unverhältnismäßigen Aufwand erfüllt werden könnte (vgl. 
Schantz, in BeckOK 2020: Art. 5, Rn. 25). Zentral ist, ob im Einzelfall eine ebenso 
effektive Alternative zur Datenverarbeitung mit geringerer Eingriffstiefe gegeben 
wäre. Sofern sich der Verarbeitungszweck mit anonymisierten oder pseudonymi- 
sierten Daten erreichen lässt, muss dies nach dem Grundsatz der Datenminimie- 
rung entsprechend umgesetzt werden (vgl. Buchner, in Tinnefeld/Buchner/Petri/ 
Hof 2019: 240 f. und Pötters, in Gola 2022: Art. 5, Rn. 23). Auch für die Forschung 
normiert Art. 89 Abs. 1 S. 1 DS-GVO den Grundsatz der Datenminimierung und 
findet sich dort als „geeignete Garantie“ für die Verarbeitung zu wissenschaftlichen 
Forschungszwecken wieder. 


5 Richtigkeit 


Der Grundsatz der „Richtigkeit“ der Daten wird in der Verordnung in Art. 5 Abs. 1 
lit. d DS-GVO normiert. Hiernach müssen personenbezogene Daten „sachlich 
richtig und erforderlichenfalls auf dem neusten Stand sein“. Der Verantwortliche 
muss für personenbezogene Daten, die „unrichtig“ sind, „alle angemessenen Maß- 
nahmen“ ergreifen, um die unrichtigen Daten zu löschen oder zu berichtigen. Der 
Grundsatz erstreckt sich insofern auch auf die Betroffenenrechte der betroffenen 
Person, der das Recht auf Berichtigung gemäß Art. 16 und Löschung gemäß Art. 17 
DS-GVO ihrer personenbezogenen Daten gewährt wird. Die Verpflichtung auf Wei- 
tergabe dieser Informationen gemäß Art. 19 DS-GVO geht ebenfalls daraus hervor. 


6 Speicherbegrenzung 


Der Grundsatz der Speicherbegrenzung verfolgt ein ähnliches Ziel wie die Daten- 
minimierung. Dabei wird jedoch weniger auf die Datenerhebung an sich, sondern 
auf den Umgang einmal erhobener personenbezogener Daten abgestellt. Gemäß 
Art. 5 Abs. 1 lit. e DS-GVO müssen personenbezogene Daten grundsätzlich in einer 
Form gespeichert werden, die eine Identifizierung der betroffenen Person nur so 
lange ermöglicht, wie dies zur Erreichung der Verarbeitungszwecke erforderlich 
ist. Die Verarbeitung personenbezogener Daten unterliegt somit einer zeitlichen 
Grenze (vgl. Roßnagel, in Simitis/Hornung/Spiecker 2022: Art 5, Rn. 154 und 
Buchner in Tinnefeld/Buchner/Petri/Hof 2019: 241). Für die Forschung ist hier- 
von eine Ausnahme vorgesehen (vgl. Herbst, in Kühling/Buchner 2020: Art. 5, 


194 


Vanessa Lettieri 


Rn. 69 und Roßnagel, in Simitis/Hornung/Spiecker 2022: Art 5, Rn. 161): Soweit 
geeignete Garantien gemäß Art. 89 Abs. 1 DS-GVO getroffen werden, dürfen per- 
sonenbezogene Daten länger gespeichert werden, sofern die Daten ausschließlich 
für wissenschaftliche Forschungszwecke verarbeitet werden. 


7 Datensicherheit („Integrität und Vertraulichkeit“) 


Die Gewährleistung „Integrität und Vertraulichkeit“ der Daten ist in Art. 5 Abs. 1 lit. 
f DS-GVO geregelt. Personenbezogene Daten müssen demnach „in einer Weise ver- 
arbeitet werden, die eine angemessene Sicherheit“ (sogenannte Datensicherheit), 
durch geeignete technische und organisatorische Maßnahmen, erfüllt. Im Sinne 
der klassischen Ziele der IT-Sicherheit gehört hierzu der Schutz vor „unbefugter 
oder unrechtmäßiger Verarbeitung“ und vor unbeabsichtigtem Verlust, Zerstörung 
oder Beschädigung (vgl. Deusch/Eggendorfer, in Taeger/Pohle 2021: Rn. 6 ff. und 
Schantz, in BeckOK 2020: Art. 5, Rn. 35 f.). Der Grundsatz der Datensicherheit 
wird weiter in Art. 32 DS-GVO konkretisiert, der die Sicherheit der Verarbeitung 
normiert, wozu u.a. die Pseudonymisierung und die Verschlüsselung personenbe- 
zogener Daten fallen. 


8 Technische und organisatorische Maßnahmen/Umsetzung der Grundsätze 


Der Verantwortliche einer Datenverarbeitung hat nach Art. 25 Abs. 1 DS-GVO 
„geeignete technische und organisatorische Maßnahmen“, zu treffen, „die dafür 
ausgelegt sind, die Datenschutzgrundsätze wie etwa Datenminimierung wirksam 
umzusetzen und die notwendigen Garantien in die Verarbeitung aufzunehmen, um 
den Anforderungen dieser Verordnung zu genügen und die Rechte der betroffenen 
Personen zu schützen“. Daraus folgt die Verpflichtung für den Verantwortlichen, 
die in der DS-GVO verankerten datenschutzrechtlichen Grundsätze schon bei der 
technischen und organisatorischen Gestaltung von Datenverarbeitungsprozessen 
sowie Datenverarbeitungstechnologien umzusetzen (vgl. RatSWD 2020: 13 und 
Hartung, in Kühling/Buchner 2020: Art. 25, Rn. 15 und Martini, in Paal/Pauly 
2021: Art. 25, Rn. 25 und Nolte/Werkmeister, in Gola 2021: Art. 24, Rn. 11). Die 
Verarbeitung personenbezogener Daten und die Einhaltung „geeigneter Garantien 
für die Rechte und Freiheiten der betroffenen Personen“ zu wissenschaftlichen For- 
schungszwecken richtet sich nach Art. 89 DS-GVO und soll durch technische und 
organisatorische Maßnahmen sichergestellt werden. Denn die Datenverarbeitung 
zu Forschungszwecken muss geeigneten Garantien für die Datenschutzrechte und 
-freiheiten unterliegen, wobei sichergestellt werden muss, dass technische und or- 
ganisatorische Maßnahmen bestehen, die diesem Grundsatz Rechnung tragen. Im 
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Hinblick auf diese Maßnahmen nennt Art. 89 Abs. 1 S. 3 DS-GVO die Pseudonymi- 
sierung, welche auch dem Grundsatz der Datenminimierung Rechnung tragen soll 
(vgl. Weichert ZD 2020: 18 ff.) Die Anonymisierung wird in dieser Vorschrift nicht 
explizit genannt. Der Erwägungsgrund 26 der Verordnung legt dahingehend aber 
fest, dass die DS-GVO nicht für „anonyme Informationen“ gilt. 


IV. Anonymisierte und pseudonymisierte Daten 


Gemäß Art. 2 Abs. 1 DS-GVO ist der Anwendungsbereich des Datenschutzrechts 
eröffnet, soweit eine Verarbeitung personenbezogener Daten erfolgt. Um eine 
Datenverarbeitung risikofreier zu gestalten, wird in der DS-GVO auf die Pseudo- 
nymisierung und Anonymisierung verwiesen. Dabei ist vorwegzugreifen, dass ein 
Personenbezug und damit die Anwendung der DS-GVO auch dann anzunehmen 
ist, wenn Daten pseudonymisiert werden. Nur eine Anonymisierung (nicht der 
Anonymisierungsvorgang selbst) schließt den Personenbezug und damit die An- 
wendung der DS-GVO aus (vgl. Ernst, in Paal/Pauly 2021: Art. 4, Rn. 48 und siehe 
Erwägungsgrund 26 DS-GVO). 


1 Pseudonymisierte Daten 


Pseudonymisierte Daten gelten, sofern die Zuordnung zu einer Person wieder- 
hergestellt werden kann, weiterhin als personenbezogene Daten, sodass diese in 
den Anwendungsbereich der DS-GVO fallen (vgl. Schild, in BeckOK 2020: Art. 4, 
Rn. 78). Gemäß der Legaldefinition in Art. 4 Nr. 5 liegt eine Pseudonymisierung 
vor, wenn die Daten ohne Hinzuziehung zusätzlicher Informationen nicht mehr 
einer spezifischen betroffenen Person zugeordnet werden können. Informationen 
über eine betroffene Person sowie daran anknüpfende Informationen müssen in 
diesem Rahmen gesondert aufbewahrt werden und technischen und organisato- 
rischen Maßnahmen unterliegen, die gewährleisten, dass die personenbezogenen 
Daten einer identifizierten oder identifizierbaren natürlichen Person nicht zuge- 
wiesen werden. Die Pseudonymisierung wird etwa bei wissenschaftlichen Studien 
genutzt, um die datenschutzrechtlichen Grundsätze umzusetzen, aber dennoch 
die Möglichkeit zu haben, einzelne Studienteilnehmende für Rückfragen kontak- 
tieren zu können (vgl. Weichert 2020: 125). 


2 Anonymisierte Daten 


Die DS-GVO findet auf anonymisierte Daten dagegen gemäß Erwägungsgrund 26 
der DS-GVO keine Anwendung. Dabei ist die Anonymisierung in der Verordnung 
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nur rudimentär geregelt (Roßnagel ZD 2021: 188 f.), auch wenn diese in diver- 
sen Regelungen vorausgesetzt wird (BfDI 2020: 2). Auch einige Datenschutzge- 
setze der Länder fordern die personenbezogenen Daten zu anonymisieren, sobald 
dies nach dem Forschungs- oder Statistikzweck möglich ist (siehe z.B. 8 17 DSG 
NRW). Unter der Anonymisierung versteht man das Verändern personenbezogener 
Daten derart, dass die Einzelangaben über persönliche oder sachliche Verhältnisse 
nicht mehr oder nur mit einem unverhältnismäßigen Aufwand an Zeit, Kosten und 
Arbeitskraft einer bestimmten oder bestimmbaren natürlichen Person zugeordnet 
werden können (vgl. Roßnagel ZD 2021: 188 f. und Ernst, in Paal/Pauly 2021: 
Art. 4 Rn. 48). Dabei sind der Anonymisierungsvorgang selbst und das Resultat des 
Anonymisierungsvorgangs, die „anonymen“ Daten, zu unterscheiden. 

Der Anonymisierungsvorgang als solcher ist als eine Datenverarbeitung ein- 
zustufen und unterfällt demnach dem Anwendungsbereich der DS-GVO, sodass er 
einer Legitimationsgrundlage bedarf (vgl. BfDI 2020: 5 und Roßnagel ZD 2021: 
188 f., strittig dazu Thüsing/Rombey ZD 2021: 548 f.). Dabei müssen Maßnahmen 
ergriffen werden, die das Risiko stetig validieren, minimieren und bestenfalls ver- 
hindern (vgl. BfDI 2020: 4), beispielsweise die Wahl eines hinreichend sicheren 
technischen Verfahrens zur Datenanonymisierung, die fortlaufende Beobachtung 
und Berücksichtigung der technischen Entwicklung und technischen Schwachstel- 
len im Anonymisierungsverfahren. 

Entscheidend für die Beurteilung, ob anonyme Daten vorliegen, ist die Fra- 
ge, ab wann eine Person nicht mehr als identifizierbar einzustufen ist. Erwägungs- 
grund 26 der DS-GVO legt fest, dass dafür alle Mittel berücksichtigt werden sollen, 
die von dem Verantwortlichen oder einer anderen Person nach allgemeinem Er- 
messen wahrscheinlich zur Identifizierung genutzt werden. Dabei ist umstritten, 
ob auf das etwaige Wissen Dritter abzustellen ist und es für die Re-Identifizie- 
rungs-Prognose berücksichtigt werden muss. Nach der absoluten Theorie muss 
die Zuordnung einer Einzelangabe zu einer konkreten Person für jedermann un- 
möglich sein (vgl. Schmidt, in Taeger/Gabel 2022: Art. 2, Rn. 7). Unterschiedlich 
stuft die relative Theorie die Anonymisierung ein, wonach lediglich die Mittel 
zu berücksichtigen sind, die der jeweiligen verantwortlichen Stelle tatsächlich 
und im konkreten Einzelfall zur Verfügung stehen, um den Personenbezug fest- 
zustellen (sogenannte „faktische Anonymität“) (vgl. Karg, in Simitis/Hornung/ 
Spiecker 2022: Art. 4, Rn. 59). Auch wenn umstritten ist, ob eine Anonymisierung 
voraussetzt, dass die Re-Identifizierung unmöglich ist, ist mittlerweile davon aus- 
zugehen, dass es in Anbetracht der sich laufend weiterentwickelnden technischen 
Möglichkeiten, wie KI-gestützter Datenverarbeitung, Big Data und Co. keine abso- 
lute Anonymität von Daten mehr geben kann (vgl. Hackenberg, in Hoeren/Sieber/ 
Holznagel 2021: Teil 15.2 Rn. 53 und Roßnagel ZD 2021: 188 f. und Ziebarth, in 
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Sydow 2018: Art. 4 Rn. 29 f.). Ausreichend sei in der Regel, dass eine Re-Identi- 
fizierung praktisch nicht durchführbar ist (vgl. BfDI 2020: 4). Die Einstufung einer 
hinreichenden Anonymisierung eines Datensatzes sollte die studiendurchführende 
Person gemeinsam mit einem Datenschutzbeauftragten zuvor genauestens prüfen 
und bewerten. 


V. Datenverarbeiter und weitere Pflichten aus der DS-GVO 


Die DS-GVO sieht für den Verantwortlichen einer Datenverarbeitung diverse Pflich- 
ten vor. Neben dem Führen eines Verarbeitungsverzeichnisses gemäß Art. 30 DS- 
GVO (Forschungsprotokoll) sowie der Gewährleistung der Betroffenenrechte, muss 
der Verantwortliche unter gewissen Voraussetzungen einen Datenschutzbeauf- 
tragten gemäß Art. 37 DS-GVO bestellen. Je nachdem wie das Forschungsprojekt 
ausgestaltet ist, kann auch die Durchführung einer Datenschutzfolgenabschätzung 
gemäß Art. 35 DS-GVO und die Einbeziehung einer Ethikkommission erforderlich 
sein. 


1 Wahrung von Betroffenenrechten 


Betroffenen Personen wird in der DS-GVO eine Reihe von sogenannten Betroffenen- 
rechten eingeräumt. Diese sind in den Art. 15 f. DS-GVO geregelt und beinhalten 
das Auskunftsrecht, Berichtigungsrecht, das Recht auf „Vergessenwerden“ (Recht 
auf Löschung), Recht auf Einschränkung der Verarbeitung, das Recht auf Daten- 
übertragbarkeit sowie das Widerspruchsrecht und das Widerrufsrecht bei einer 
einmal erteilten Einwilligung. Für die Forschung können gemäß Art. 89 Abs. 2 DS- 
GVO „vorbehaltlich der Bedingungen und Garantien“, „Ausnahmen von den Rech- 
ten“ vorgesehen werden, sofern diese Rechte die Zwecke der Datenverarbeitung 
unmöglich machen oder ernsthaft beeinträchtigen. Um von den zuvor genannten 
Rechten Gebrauch machen zu können, muss die betroffene Person zunächst trans- 
parent und nachvollziehbar in Kenntnis gesetzt werden, auf welche Art und Weise 
ihre personenbezogenen Daten verarbeitet werden (vgl. Buchner, in Tinnefeld/ 
Buchner/Petri/Hof 2019: 291 und Franck, in Gola: 2018 Art. 13 Rn. 2 f.). Dazu 
sieht das Datenschutzrecht die Informationspflichten durch Verantwortliche einer 
Datenverarbeitung in Art. 13 f. DS-GVO vor. 


2 Informationspflicht 


Artikel 13 und 14 DS-GVO normieren die Informationspflichten des für die Daten- 
verarbeitung Verantwortlichen und differenzieren sich danach, ob die Daten direkt 
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bei der betroffenen Person oder durch Dritte bzw. andere Quellen erhoben worden 
sind. Bei der Direkterhebung muss die betroffene Person zum Zeitpunkt der Er- 
hebung bereits über die Datenverarbeitung informiert werden. Bei Dritterhebun- 
gen beginnt die Frist ab dem Zeitpunkt des Erhalts der Daten, und die betroffene 
Person muss binnen eines Monats über die Datenverarbeitung aufgeklärt werden. 
Die für die Datenschutzerklärung notwendigen Angaben sind in Art. 13 f. DS-GVO 
normiert und beinhalten die Rechtsgrundlage der Datenverarbeitung, die Art, den 
Umfang und die Dauer sowie den Zweck der Datenverarbeitung. Ebenfalls muss 
auf die Betroffenenrechte verwiesen und die Kontaktdaten des Verantwortlichen 
müssen für die Datenverarbeitung angegeben werden. Auch auf eine potenzielle 
Datenübermittlung in das Nicht-EU-Ausland muss hingewiesen werden. 


VI. Anwendbare Regelungen der Datenverarbeitung zu 
Forschungszwecken 


In Deutschland ist das Datenschutzrecht durch ein Nebeneinander von allgemei- 
nen und bereichsspezifischen Datenschutzregelungen gekennzeichnet (vgl. Buch- 
ner, in Tinnefeld/Buchner/Petri/Hof 2019: 218 und Roßnagel ZD 2019: 157). Bei 
einer Verarbeitung personenbezogener Daten sind demnach neben der DSGVO 
die datenschutzrechtlichen Regelungen aus dem BDSG, den Landesdatenschutz- 
gesetzen sowie weiteren bereichsspezifischen Datenschutzgesetzen zur beachten. 
Hieraus ergeben sich erhebliche Herausforderungen in der Handhabung der Vor- 
schriften zum Forschungsdatenschutz (vgl. Weichert ZD 2020: 18). Teils ist daher 
auch von einem „Flickenteppich“ an datenschutzrechtlichen Regelungen für die 
Forschung die Rede (vgl. Hänold ZD-Aktuell 2020: 07046). 

Generell können zur Legitimation der Datenverarbeitung entweder die daten- 
schutzrechtliche Einwilligung der betroffenen Person oder ein gesetzlicher Er- 
laubnistatbestand herangezogen werden. Obwohl beide Erlaubnisgrundlagen 
gleichrangig nebeneinanderstehen, ist es praktikabler, auf einen gesetzlichen 
Erlaubnistatbestand zurückzugreifen als auf eine Einwilligungserklärung (vgl. 
RatSWD 2020: 28). Je nach Verarbeitungssituation und Datenkategorie sind 
unterschiedliche Rechtsgrundlagen relevant. Demnach muss zwischen den un- 
terschiedlichen Datenkategorien „einfache“ personenbezogene Daten (Art. 6 DS- 
GVO) und sogenannten besondere Kategorien personenbezogener Daten (Art. 9 
DS-GVO) differenziert werden. Zudem muss bei der Prüfung einer einschlägigen 
Rechtsgrundlage eine Differenzierung der datenschutzrechtlichen Verantwortlich- 
keit im Hinblick auf die Trägerschaft erfolgen. Denn für öffentliche Stellen (z.B. 
Universitäten und Hochschulen) und private Einrichtungen (Unternehmen und 
Vereinen) sind unterschiedliche Gesetze zu beachten. Grundsätzlich gilt das BDSG 
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gemäß § 1 Abs. 1 nur für öffentliche Stellen des Bundes und für nichtöffentliche 
Stellen. Für die öffentlichen Stellen der Länder greifen die Landesdatenschutz- 
gesetze der jeweiligen Länder (vgl. RatSWD 2020: 15). Exemplarisch zu nennen 
ist § 17 DSG NRW, welcher die Datenverarbeitung personenbezogener Daten zu 
wissenschaftlichen oder historischen Forschungszwecken oder zu statistischen 
Zwecken für das Land Nordrhein-Westfalen normiert. 


1  Datenschutzrechtliche Einwilligung 


Die datenschutzrechtliche Einwilligung der betroffenen Person ist ein zentrales 
Instrument zur Legitimation der Verarbeitung von personenbezogenen Daten, die 
in der Praxis oftmals für Verarbeitungsvorgänge herangezogen wird, für die kei- 
ne gesetzliche Ermächtigungsgrundlage greift (vgl. Sassenberg, in Specht/Mantz 
2019: Rn. 33). Aus der DS-GVO ergibt sich die grundsätzliche Möglichkeit zur 
Einholung der Einwilligung als Legitimation einer Datenverarbeitung allgemein 
aus Art. 6 Abs. 1 lit. a DS-GVO und für besondere Kategorien personenbezogener 
Daten aus Art. 9 Abs. 2 lit. a DS-GVO. Dabei gelten für die Einwilligung nach Art. 9 
Abs. 2 lit. a DS-GVO besondere Voraussetzungen, da sich diese ausdrücklich auf die 
Verarbeitung sensitiver Daten beziehen muss (vgl. Albers/Veit, in BeckOK 2020: 
Art. 9, Rn. 60). 

In Art. 4 Nr. 11 DS-GVO sind die Wirksamkeitsvoraussetzungen zur Erteilung 
der datenschutzrechtlichen Einwilligung normiert und als „jede freiwillig für den 
bestimmten Fall, in informierter Weise und unmissverständlich abgegebene Wil- 
lensbekundung in Form einer Erklärung oder einer sonstigen eindeutigen bestä- 
tigenden Handlung, mit der die betroffene Person zu verstehen gibt, dass sie mit 
der Verarbeitung der sie betreffenden personenbezogenen Daten einverstanden 
ist“, beschrieben (vgl. Buchner/Kühling, in Buchner/Kühling 2020: Art. 4 Nr. 11, 
Rn. 1). Zentrale Voraussetzungen für eine wirksame Einwilligung sind demnach 
deren Freiwilligkeit, Zweckbindung bzw. Zweckbestimmtheit und Informiert- 
heit. Eine Einwilligungserklärung eines Betroffenen ist aus datenschutzrechtlicher 
Sicht nicht mehr als freiwillig anzusehen, wenn die Person keine wirkliche oder 
freie Wahl hat, ihre Einwilligung (nicht) zu erteilen oder zurückzuziehen, ohne 
dadurch Nachteile zu erleiden. Aufgrund des sogenannten „Kopplungsverbot“ darf 
die Einwilligung deshalb grundsätzlich nicht als Bedingung für eine Gegenleis- 
tung eingesetzt werden (vgl. Buchner, in Kühling/Buchner 2020: Art. 4, Rn. 11 
und Schulz, in Gola 2018: Art. 7, Rn. 21 und Taeger, in Taeger/Gabel 2022: Art. 
2, Rn. 94 f.). Dabei muss die Einwilligungserklärung so präzise wie möglich für 
einen oder mehrere bestimmte Zwecke erteilt und darf nicht pauschal eingeholt 
werden (siehe Zweckbindungsgrundsatz) (vgl. BfDI 2020: 40 und Ernst, in Paal/ 
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Pauly 2021: Art. 4, Rn. 78) und in informierter, aufgeklärter Weise erfolgen, damit 
sie Wirksamkeit entfaltet (vgl. Weichert 2022: 95). Artikel 7 DS-GVO listet wei- 
tere formale Bedingungen für eine rechtswirksame Einwilligung hinsichtlich der 
Form, Transparenz, dem Zeitpunkt und der betroffenen Person auf. Hierbei muss 
der datenschutzrechtlich Verantwortliche grundsätzlich nachweisen können, dass 
die betroffene Person in die Datenverarbeitung eingewilligt hat. Auch wenn die 
DS-GVO keine formalen Anforderungen an die Einwilligungserklärung erteilt und 
diese sowohl mündlich als auch schriftlich erfolgen kann, ist es zu Nachweisbar- 
keitszwecken ratsam, eine schriftliche Einwilligungserklärung einzuholen, die in 
leichter und verständlicher Form und Sprache ausgestaltet ist. 


a. Widerrufbarkeit 


Entscheidend für die Beschaffenheit der Einwilligung und insbesondere der Wah- 
rung der Freiwilligkeit ist, dass die betroffene Person gemäß Art. 7 Abs. 3 DS-GVO 
das Recht hat, die Einwilligung jederzeit mit Wirkung für die Zukunft zu wider- 
rufen. Der Verantwortliche einer Datenverarbeitung muss zum Zeitpunkt der 
Erteilung der Einwilligung über die Möglichkeit des Widerrufs informieren. Der 
Widerruf gilt sodann für jede zukünftige Verarbeitung ebendieser personenbezo- 
genen Daten. Die bis zum Eingang des Widerrufs erfolgte Datenverarbeitung bleibt 
hiervon unberührt und rechtmäßig. Der Widerruf muss genauso leicht erklärt 
werden können wie das Erteilen der Einwilligung selbst. Datenschutzrechtlich 
Verantwortliche sollten aufgrund der jederzeitigen Widerrufsmöglichkeit sicher- 
stellen, dass eine Beendigung der Datenverarbeitung nach Eingang der Widerrufs- 
erklärung möglich ist. Sofern eine Einwilligung nicht widerrufen wird, sieht die 
DS-GVO grundsätzlich keine zeitliche Begrenzung oder automatischen Zeitablauf 
vor (vgl. Heckmann/Paschke, in Ehmann/Selmayr 2018: Art. 7, Rn. 43). Demnach 
gilt eine Einwilligung grundsätzlich so lange, bis sie widerrufen wird. Es wird al- 
lerdings empfohlen, die Einwilligung in angemessenen Zeitabständen zu erneuern 
(vgl. Artikel-29-Datenschutzgruppe 2018: 25). 


b. Die erweiterte Einwilligung „Broad Consent“ in der Forschung 


Bei der Verarbeitung personenbezogener Daten im Rahmen der wissenschaftlichen 
Forschung ist es oftmals zum Zeitpunkt der Erhebung der Daten nicht möglich, den 
Zweck der Verarbeitung hinreichend zu bestimmen. Die Verordnung sieht in dem 
Erwägungsgrund 33 für diese Besonderheit vor, dass betroffene Personen ihre Ein- 
willigung für bestimmte Bereiche wissenschaftlicher Forschung erteilen können, 
den sogenannten „Broad Consent“, wenn dies unter Einhaltung der anerkannten 
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ethischen Standards der wissenschaftlichen Forschung geschieht. Damit soll der 
Broad Consent nicht eine Möglichkeit darstellen, den Grundsatz der Zweckbe- 
stimmtheit zu umgehen, denn die erweiterte Einwilligung soll weiterhin nur als 
Ausnahme greifen, wenn eine konkrete Zweckbestimmung nicht möglich ist (vgl. 
BfDI 2020: 40). Die erweiterte Einwilligung findet sich für den Sozialbereich exem- 
plarisch in § 67b Abs. 3 SGB X wieder. Eine weitere Vorschrift im Sozialrecht, die 
mit Blick auf die Einwilligung hervorzuheben ist, stellt 8 75 SGB X dar, die gesetz- 
lich festgelegte tatbestandliche Erfordernisse mit der datenschutzrechtlichen Ein- 
willigung kombiniert (vgl. Westphal, in BeckOK 2020: 8 75, Rn. 3 ff.). 


c. Datenschutzrechtliche Einwilligung Minderjähriger/Schutzbedürftiger 


Für die datenschutzrechtliche Einwilligung Minderjähriger sind besondere Schutz- 
vorkehrungen zu treffen. Die DS-GVO sieht in Art. 8 „Bedingungen für die Einwil- 
ligung eines Kindes“ vor, diese beziehen sich allerdings lediglich auf Dienste der 
Informationsgesellschaft (vgl. Schulz, in Gola 2022: Art. 8, Rn. 12. und Sassen- 
berg, in Specht/Mantz 2019: § 24, Rn. 42). Die Vorschrift normiert eine Alters- 
grenze von 16 Jahren als „Mindesteinwilligungsalter“ zum besonderen Schutz von 
Minderjährigen (vgl. Sassenberg, in Specht/Mantz 2019: § 24, Rn. 42 und Heck- 
mann/Paschke, in Ehmann/Selmayr 2018: Art. 8, Rn. 16). Grundsätzlich kann 
man die Altersgrenze auch auf andere Verarbeitungstätigkeiten erstrecken (vgl. 
Artikel-29-Datenschutzgruppe 2018: 28 und edpb 2020: 30). Folglich gilt für Ver- 
arbeitungen personenbezogener Daten von Person, die das 16. Lebensjahr noch 
nicht vollendet haben, dass eine Einwilligung durch den Erziehungs- oder Sorge- 
berechtigten bzw. Vormund eingeholt werden muss (vgl. Heckmann/Paschke, in 
Ehmann/Selmayr 2018: Art. 8, Rn. 15). 

Exemplarisch zu nennen ist § 120 II S. 2 SchulG NRW, welcher für die Erhebung 
weiterer Daten bei minderjährigen Personen die Zustimmung der gesetzlichen Ver- 
treter fordert, wenn die befragten Minderjährigen die Tragweite der Einwilligung 
nicht erfassen können. 

Für die Datenverarbeitung im Zusammenhang mit Minderjährigen, insbeson- 
dere der Konkretisierung der Altersgrenzen sowie praktischen Vorgehensweise, 
bildet die Richtlinie für die Befragung von Minderjährigen von den Verbänden der 
Markt- und Sozialforschung in Deutschland eine praktische Handlungsanleitung 
(siehe Richtlinie für die Befragung von Minderjährigen 2021). 
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2 Gesetzliche Erlaubnistatbestände 


Neben der datenschutzrechtlichen Einwilligung kommen gesetzliche Erlaubnis- 
tatbestände in Betracht. Zentrales Regelungswerk stellt die DS-GVO dar. Die in 
Art. 89 DS-GVO verankerte Forschungsprivilegierung, die im Rahmen der Daten- 
verarbeitungsgrundsätze vorgestellt wurde, räumt Datenverarbeitungen zu For- 
schungszwecken zwar diverse rechtliche Begünstigungen ein, enthält allerdings 
keine Legitimationsgrundlage zur Verarbeitung von personenbezogenen Daten 
(vgl. Raum, in Ehmann/Selmayr 2018: Art. 89, Rn. 1). 

Für die Verarbeitung „einfacher“ Forschungsdaten durch öffentliche Stellen 
ist eine Verarbeitung unter bestimmten Voraussetzungen nach Art. 6 Abs. 1 lit. e 
DS-GVO möglich, für den Sozialbereich kann ebenfalls lit. e oder auch lit. c ein- 
schlägig sein, sofern die Verarbeitung aufgrund einer rechtlichen Verpflichtung 
resultiert (vgl. Kipker/Pollmann, in Specht/Mantz 2019: 8 26, Rn. 13). Für beson- 
dere Kategorien personenbezogener Daten sieht die Verordnung in Art. 9 Abs. 2 
lit. b eine Legitimationsgrundlage für die Erfüllung von bestimmten Pflichten im 
Bereich der sozialen Sicherheit und des Sozialschutzes vor (vgl. Kipker/Pollmann, 
in Specht/Mantz 2019: § 26, Rn. 15). Für die wissenschaftliche Forschung kann 
Art. 9 Abs. 2 lit. j DS-GVO einschlägig sein. Daneben enthalten das BDSG sowie die 
Landesdatenschutzgesetze und auch die Schulgesetze und -ordnungen der Länder, 
Sonderregelungen für Datenverarbeitungen zu Forschungszwecken. Das BDSG 
sieht z.B. in 8 27 die Verarbeitung besonderer Datenkategorien auch ohne Einwil- 
ligung für wissenschaftliche Forschungszwecke als zulässig an, wenn die Verarbei- 
tung zu diesen Zwecken erforderlich ist und die Interessen des Verantwortlichen 
an der Verarbeitung die Interessen der betroffenen Person an einem Ausschluss 
der Verarbeitung erheblich überwiegen. Auf der Ebene der Landesdatenschutzge- 
setze sieht der bereits dargelegte § 17 DSG NRW in Absatz 1 vor, dass eine Ver- 
arbeitung auch ohne Einwilligung zulässig sein kann, wenn die Verarbeitung zu 
wissenschaftlichen Forschungszwecken erforderlich und schutzwürdige Belange 
der betroffenen Person nicht überwiegen. Hierbei stellen sich allerdings die Ab- 
grenzung des Erforderlichkeits-Begriffs und die Interessenabwägung in der Praxis 
als problematisch dar. 

Als besondere Regelung, die die bereichsspezifischen gesetzlichen Anforde- 
rungen mit der Einwilligung verknüpft, wurde die Vorschrift des 8 75 SGB X bereits 
unter der Einwilligung vorgestellt. Der Paragraf regelt die Übermittlung von So- 
zialdaten für die Forschung. 
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3 Regelungen bei Datenverarbeitungen an Schulen 


Bei der Verarbeitung personenbezogener Daten im Rahmen wissenschaftlicher 
Untersuchungen, z.B. durch Datenerhebung in Form von Fragebögen, Inter- 
views oder Tests an Schulen, müssen besondere Schutzmaßnahmen (siehe Da- 
tenschutzgrundsätze und Ausgestaltung der technischen und organisatorischen 
Maßnahmen, insbesondere Anonymisierung) getroffen werden, da Daten von 
Minderjährigen oder besonders vulnerablen Personen betroffen sind. Grund- 
sätzlich sind Datenerhebungen an Schulen in Deutschland genehmigungs- oder 
anzeigepflichtig (vgl. VerbundFDB, Übersicht über die länderspezifischen Beson- 
derheiten). Dabei können für Forschungsvorhaben im Kontext von universitären 
Abschlussarbeiten oder wissenschaftlichen Untersuchungen unterschiedliche 
Regelungen gelten (vgl. VerbundFDB, Übersicht über die länderspezifischen Be- 
sonderheiten), die je nach Bundesland und Einrichtung gesondert geprüft werden 
müssen. Exemplarisch normieren für das Land Nordrhein-Westfalen die 88 120- 
122 SchulG NRW die grundlegenden Regelungen für die Verarbeitung personen- 
bezogener Daten im Schulbereich. § 120 SchulG NRW bestimmt den „Schutz der 
Daten von Schülerinnen und Schülern sowie Eltern“. Die Allgemeine Schulord- 
nung NRW vom 25. Juni 2002 legt in 8 47 Abs. 8 fest, dass wissenschaftliche Unter- 
suchungen nur zulässig sind, wenn dadurch die Bildungs- und Erziehungsarbeit 
und schutzwürdige Belange einzelner Personen nicht beeinträchtigt werden und 
grundsätzlich entsprechende Genehmigungen durch die Schulleitung erfolgen 
müssen und in Angelegenheiten besonderer Bedeutung die Schulaufsichtsbehörde 
zu unterrichten ist. Weitere Vorgaben werden durch die Verknüpfung des Schul- 
gesetzes mit einem Runderlass des Ministeriums für Schule und Weiterbildung v. 
15.07.1996 angeführt. 

Die Prüfung und Einordnung des gesetzlichen Legitimationstatbestands zu ei- 
ner Datenverarbeitung sollten durch einen Datenschutzbeauftragten erfolgen. Da- 
bei gelten die datenschutzrechtlichen Garantien wie Zweckbindung, Transparenz 
und Vertraulichkeit, die Gewährleistung der technischen und organisatorischen 
Maßnahmen sowie die Einhaltung der weiteren Pflichten des datenschutzrechtlich 
Verantwortlichen für alle Verarbeitungen personenbezogener Daten übergreifend 
und überschneidend (vgl. Kipker/Pollmann, in Specht/Mantz 2019: § 26, Rn. 15). 


204 


Vanessa Lettieri 


VII. Fazit 


Die grundlegenden datenschutzrechtlichen Kenntnisse sind für die Einhaltung des 
Datenschutzes für die empirisch arbeitende Forschung wesentlich, um Daten für 
Forschungsvorhaben verfügbar und nachnutzbar zu machen, den verantwortungs- 
vollen Umgang mit Daten zu gewährleisten und die Integrität der Wissenschaft 
zu festigen. Die vorliegende Abhandlung soll einen Überblick über die wichtigs- 
ten Begriffe und Grundsätze des Datenschutzes für Studierende und Forschende 
übermitteln. Bei einer konkreten Datenverarbeitung sollte nichtsdestotrotz ge- 
nauestens geprüft werden, ob die Hinzuziehung und Beratung durch einen Daten- 
schutzbeauftragten bzw. eine Datenschutzbeauftragte erforderlich sind, um die 
Datenverarbeitung aus rechtlicher Sicht sicher und rechtskonform zu gestalten. In 
Einzelfällen kann auch die zuständige Aufsichtsbehörde um Stellungnahme gebe- 
ten werden. 
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Fragebogen/Checkliste im Rahmen einer Datenverarbeitung? 


Werden personenbezogene Daten verarbeitet? 
O Welche personenbezogenen Daten werden verarbeitet? 
Mm Handelt es sich um „einfache“ personenbezogene Daten? 


Handelt es sich um besondere Kategorien personenbezogener Daten? 
Sind personenbezogene Daten von Minderjährigen oder Schutzbedürftigen 
betroffen? 


Auf welcher Grundlage werden personenbezogene Daten verarbeitet? 

O Werden personenbezogene Daten zum ersten Mal erhoben (Primärdatener- 
hebung) oder zu anderen als den ursprünglichen Zwecken weiterverarbeitet 
(Sekundärnutzung)? 


000 


Gibt es eine Rechtsgrundlage, die die Datenverarbeitung legitimiert? 
Müssen innerhalb dessen Maßnahmen ergriffen werden? 
Wird eine Einwilligung zur Legitimation der Datenverarbeitung eingeholt? 


Ist die Einwilligung tatsächlich freiwillig? 
Ist die Einwilligung „informiert“ erfolgt? 


Kann der Forschungszweck genau definiert werden? (Stichwort: Broad Consent) 
Welche Daten werden zur Erreichung des Zwecks konkret benötigt? (Stichwort: 
Datenminimierung) 

Werden betroffene Personen gemäß Art. 13 und 14 DS-GVO transparent über die 
Datenverarbeitung informiert? 

O Enthält die Datenschutzinformation alle wesentlichen Angaben? 


Rechtsgrundlage der Datenverarbeitung: Tatbestände aus der DS-GVO oder 
dem nationalen Recht (Einwilligung oder gesetzlicher Erlaubnistatbestand) 
Art, Umfang und Dauer der Datenverarbeitung: Welche Daten(-kategorie) 
wird auf welche Weise und für wie lange verarbeitet? Unterstützen Dritte bei 
der Datenverarbeitung oder werden Daten an Dritte übermittelt? Gibt es Ar- 
chivierungs- oder Löschfristen? 

Zweck der Datenverarbeitung: Was ist der Zweck der konkreten Datenver- 
arbeitung und ist diese zur Erreichung des Zwecks tatsächlich erforderlich? 
Wird der ursprüngliche Zweck der Datenerhebung eingehalten oder wurde 
der Zweck nachträglich geändert? 

Betroffenenrechte: Betroffene Personen sind bei jeder Datenverarbeitung 
über ihre Rechte aufzuklären. Sofern eine Einwilligung erteilt wurde, ist auf 
die Möglichkeit des Widerrufs hinzuweisen. 

Kontaktdaten des Verantwortlichen (sofern gegeben Kontakt des Daten- 
schutzbeauftragten) 

Datenübermittlung in das Nicht-EU-Ausland: Erfolgt eine Datenübermitt- 
lung ins Nicht-EU-Ausland? Bestehen mit diesem Land gültige Datenschutz- 
abkommen bzw. werden anderweitige Garantien vorgesehen, um einen 
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Der Fragenkatalog dient als Orientierungsleitfaden und erhebt keinen Anspruch auf 
Vollständigkeit. 
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angemessenen, dem europäischen Niveau entsprechenden Maßstab auch im 
Ausland zu gewährleisten? 

Werden Betroffenenrechte berücksichtigt und kann diesen nachgekommen wer- 

den? 

O Können Anfragen von betroffenen Personen bezüglich Auskunft, Berichti- 
gung, Einschränkung, Löschung, Widerspruch, Übertragung, Sperrung be- 
antwortet werden? (Beachtung Ausnahmen für die Forschung Art. 89 Abs. 2 
DS-GVO) 

Sind Dritte an der Datenverarbeitung beteiligt und wurde mit diesen Verträgen 

zur Auftragsverarbeitung o.Ä. geschlossen? 

Sind weitere Personen, die an der Datenverarbeitung beteiligt sind, auf das Da- 

tengeheimnis verpflichtet worden? 

Wurde die Universität/Hochschule/Schule über die Datenverarbeitung infor- 

miert? 

O Haben Abstimmungen mit dem Datenschutzbeauftragten der Schule/Uni- 
versität stattgefunden? 

Werden Daten außerhalb der Europäischen Union verarbeitet in sogenannten 

„unsicheren Drittstaaten“ (z.B. USA)? Werden Dienstleister oder Software ein- 

gesetzt, die ihren Sitz außerhalb der Europäischen Union haben? 

Wurde ein Verzeichnis der Verarbeitungstätigkeiten gemäß Art. 30 DS-GVO an- 

gelegt (Forschungsprotokoll)? 

Gibt es ein Konzept zur Speicherung und Aufbewahrung bzw. Löschung von 

Daten? 

Werden geeignete technische und organisatorische Maßnahmen ergriffen, die 

die Datensicherheit gewährleisten? 

O Wie werden die Daten verarbeitet? Welche Software oder Dienstleister un- 
terstützen dabei? Wurde mit diesen Dienstleistern ein Vertrag zur Auftrags- 
verarbeitung nach Art. 28 DS-GVO geschlossen? Ist die Software auf dem 
aktuellsten Stand? 

O Erfolgt eine Datensicherung / Backups? 

O Werden die personenbezogenen Daten anonymisiert oder pseudonymisiert 
verarbeitet? 

Muss eine Datenschutzfolgenabschätzung gemäß Art. 35 DS-GVO durchgeführt 

werden? 

Gegebenenfalls prüfen, ob ein Datenschutzbeauftragter bestellt werden muss. 

Ist die Einbeziehung einer Ethikkommission erforderlich? 

Istim Rahmen der Datenverarbeitung eine Datenpanne erfolgt? Prüfung, ob eine 

Meldung an die Aufsichtsbehörde und betroffene Person erforderlich ist. 
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Quantitative Daten in bildungswissen- 
schaftlichen Disziplinen 


In bildungswissenschaftlichen Disziplinen galt die Anwendung quan- 
titativer Forschungsmethoden bislang nicht unbedingt als disziplinärer 
Standardzugang in der Datensuche, -erhebung und -analyse. Gleichzeitig 
gewinnt im Zuge besserer Datenverfügbarkeit, u.a. auch infolge zuneh- 
mender Digitalisierung, die Arbeit mit quantitativen Daten ebenso wie 
die individuelle Kompetenz zu ihrer Erhebung und Analyse an Bedeutung. 
Diese forschungsmethodische „Soft Skill“-Lücke greift dieser Sammelband 
auf und schließt sie: Die Handreichung des multiprofessionellen Autor:in- 
nenteams beleuchtet und diskutiert die Möglichkeiten der Nutzung quan- 
titativer Daten in bildungswissenschaftlichen Disziplinen kritisch und 
vermittelt hilfreiche Kompetenzen im Bereich des Findens geeigneter 
(Sekundär-)Daten, der Umsetzung eigener Datenerhebungen, sowie weiterer 
forschungspraktischer Datenkompetenzen (bspw. Datenschutz). 
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